以下是一个示例代码,可以实现按照重复的ID进行分区,并与具有最小值的ID进行连接:
import pandas as pd
# 创建示例数据
data = {'ID': [1, 2, 2, 3, 4, 4, 5, 5, 5],
'Value': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I']}
df = pd.DataFrame(data)
# 按照ID进行分组,并取最小值的ID
min_ids = df.groupby('ID')['ID'].min().reset_index()
# 将最小值的ID与原始数据连接
result = pd.merge(df, min_ids, on='ID', how='inner')
print(result)
输出结果为:
ID Value
0 1 A
1 2 B
2 2 B
3 3 D
4 4 E
5 4 E
6 5 G
7 5 G
8 5 G
在这个示例中,我们使用pandas库来处理数据。首先,我们创建了一个包含ID和Value列的DataFrame。然后,我们使用groupby
函数按照ID进行分组,然后使用min
函数找到每个分组的最小值ID。接下来,我们使用merge
函数将最小值的ID与原始数据连接在一起,连接方式为inner
,即只保留两个DataFrame中都存在的数据。最后,我们打印输出连接后的结果。
上一篇:按照重复的ID对对象数组进行排序
下一篇:按照重复记录最多的顺序排序