假设有一个包含ID和value两列的DataFrame:
import pandas as pd
data = {'ID': ['A', 'A', 'B', 'B', 'B', 'C'],
'value': [10, 15, 5, 12, 8, 20]}
df = pd.DataFrame(data)
print(df)
输出为:
ID value
0 A 10
1 A 15
2 B 5
3 B 12
4 B 8
5 C 20
我们可以使用groupby和agg方法来实现按照ID分组并取最大值:
result = df.groupby('ID')['value'].agg('max').reset_index()
print(result)
输出为:
ID value
0 A 15
1 B 12
2 C 20
这个方法首先使用groupby方法按照ID进行分组,然后使用agg方法对每个分组的value列取最大值,最后使用reset_index方法将结果重设索引。这样我们就得到了按照ID分组并取最大值的结果。
下一篇:按照ID分组绘制相同列的数值。