假设有一个数据框df,其中有“group” 和 “value” 两列。现在我们想要按照组对“value”列进行排序,然后给“value”列赋予新的排序索引。
可以使用pandas中的groupby函数对数据进行分组,然后使用apply函数按组应用特定的操作。具体实现如下:
import pandas as pd
# 创建一个DataFrame
df = pd.DataFrame({'group': ['A', 'A', 'B', 'B', 'C', 'C'],
'value': [1, 2, 3, 4, 5, 6]})
# 对数据按组进行排序,然后对每个组的“value”列赋予新的排序索引
df['new_index'] = df.groupby('group')['value'].apply(lambda x: x.rank())
print(df)
运行结果如下:
group value new_index
0 A 1 1.0
1 A 2 2.0
2 B 3 1.0
3 B 4 2.0
4 C 5 1.0
5 C 6 2.0
以上代码先按照组对数据进行排序,然后使用apply函数应用一个匿名函数,该函数对每个组的“value”列进行排序并返回新的索引,
最后,将新的索引赋给“new_index”列。
下一篇:按组合并第一个和最后一个值