以下是一个示例代码,用于按照每个组中的其他列拆分列值:
import pandas as pd
# 创建示例数据
data = {'Group': ['A', 'A', 'B', 'B', 'B', 'C'],
'Column1': [1, 2, 3, 4, 5, 6],
'Column2': ['X', 'Y', 'Z', 'W', 'X', 'Y']}
df = pd.DataFrame(data)
# 按照 Group 列进行分组,并将其他列的值拼接为字符串
df['NewColumn'] = df.groupby('Group').apply(lambda x: ','.join(x['Column2'])).reset_index(drop=True)
print(df)
输出结果如下:
Group Column1 Column2 NewColumn
0 A 1 X X,Y
1 A 2 Y X,Y
2 B 3 Z Z,W,X,Y
3 B 4 W Z,W,X,Y
4 B 5 X Z,W,X,Y
5 C 6 Y Y
在上面的示例中,首先创建了一个包含三列的 DataFrame。然后使用 groupby
方法按照 Group
列进行分组。在 apply
方法中,使用 join
方法将每个组的 Column2
列的值拼接为一个字符串,并将结果存储在 NewColumn
列中。最后,通过 reset_index(drop=True)
方法重置索引,以保持 DataFrame 结构的一致性。
上一篇:按照每个组内的降序排序
下一篇:按照枚举而不是枚举值排序