以下是一个示例代码,演示了如何遍历数据表中相同的行:
import pandas as pd
# 创建示例数据表
data = {'Name': ['John', 'Alice', 'Bob', 'John'],
'Age': [25, 27, 30, 25],
'City': ['New York', 'Paris', 'London', 'New York']}
df = pd.DataFrame(data)
# 根据重复行的条件进行分组
groups = df.groupby(df.columns.tolist()).apply(lambda x: list(x.index)).tolist()
# 遍历每个分组并输出相同的行
for group in groups:
if len(group) > 1:
print("相同的行:", group)
print(df.iloc[group[0]]) # 输出第一个重复行的内容
print(df.iloc[group[1:]]) # 输出剩余重复行的内容
print()
这个示例使用了Pandas库来处理和操作数据表。首先,创建一个示例数据表df
,其中包含一些重复的行。然后,使用groupby
函数根据所有列的条件进行分组,并将每个分组中的行索引存储在groups
列表中。接下来,遍历每个分组,并检查是否存在重复的行。如果存在重复的行,将打印出相同的行的索引,并输出第一个重复行的内容以及剩余重复行的内容。
请注意,这个示例假设数据表中的列没有缺失值,并且所有列的数据类型都一致。如果数据表中存在缺失值或不同数据类型的列,则需要根据具体情况进行适当调整。
上一篇:遍历数据表以找到一个列中的匹配值
下一篇:遍历数据并创建新的数据框架