以下是一个示例代码,演示如何按照组进行分组,不考虑id,然后选择每个组的最大值:
import pandas as pd
# 创建示例数据
data = {'组': ['A', 'A', 'B', 'B', 'B', 'C'],
'数值': [1, 3, 2, 5, 4, 6]}
df = pd.DataFrame(data)
# 按照组进行分组,选择每个组的最大值
max_values = df.groupby('组')['数值'].max()
print(max_values)
输出结果:
组
A 3
B 5
C 6
Name: 数值, dtype: int64
在示例中,我们使用pandas库创建了一个包含两列的DataFrame。其中一列是组的标识符,另一列是数值。然后,我们使用groupby
函数按照组进行分组,然后选择每个组的最大值,使用max
函数。最后,我们打印出每个组的最大值。