以下是一个示例代码,演示了如何按照另一列的顺序将列聚合为数组:
import pandas as pd
# 创建示例数据
data = {'Name': ['Tom', 'John', 'Mike', 'Jake', 'Amy'],
'Age': [25, 30, 28, 35, 27],
'Score': [85, 90, 75, 80, 95]}
df = pd.DataFrame(data)
# 按照 'Age' 列的顺序将 'Name' 列聚合为数组
sorted_names = df.groupby('Age')['Name'].apply(lambda x: x.tolist()).reset_index()
print(sorted_names)
输出结果为:
Age Name
0 25 [Tom]
1 27 [Amy]
2 28 [Mike]
3 30 [John]
4 35 [Jake]
在上面的示例中,我们使用了groupby
函数来按照'Age'
列分组。然后,我们使用apply
函数将'Name'
列中的每个值转换为一个列表,并将结果存储在一个新的列中。最后,我们使用reset_index
函数重新设置索引,使结果显示为DataFrame的形式。