在Python中,可以使用Pandas库来按照一个列进行分组,并显示多列。下面是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {
'Name': ['Tom', 'Nick', 'John', 'Tom', 'Nick'],
'Age': [28, 32, 45, 28, 32],
'City': ['New York', 'Paris', 'London', 'New York', 'Paris'],
'Salary': [5000, 6000, 7000, 5000, 6000]
}
df = pd.DataFrame(data)
# 按照Name列进行分组,并显示Age和Salary列
grouped = df.groupby('Name')[['Age', 'Salary']].sum()
print(grouped)
输出结果如下:
Age Salary
Name
John 45 7000
Nick 64 12000
Tom 56 10000
在以上示例中,我们首先创建了一个包含Name、Age、City和Salary列的数据集。然后,使用groupby
函数按照Name列进行分组,并使用[['Age', 'Salary']]
来选择要显示的多列。最后,使用sum
函数对每个分组中的Age和Salary列进行求和。最终的结果是每个唯一的Name值作为索引,显示了对应的Age和Salary列的求和结果。