在Python中,可以使用pandas库来按照一个列对数据进行分组,然后统计另一个列中的值。下面是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'John'],
'Age': [28, 32, 25, 28, 30],
'Score': [85, 90, 78, 92, 87]}
df = pd.DataFrame(data)
# 按照Name列进行分组,统计Score列的平均值
grouped = df.groupby('Name')['Score'].mean()
print(grouped)
输出结果:
Name
John 82.5
Nick 90.0
Tom 88.5
Name: Score, dtype: float64
在上面的示例中,我们创建了一个包含Name、Age和Score列的DataFrame。然后,我们使用groupby
函数按照Name列进行分组,并通过指定['Score']来选择要统计的列。最后,我们使用mean
函数计算了每个分组中Score列的平均值。输出结果是一个Series,它以Name作为索引,以平均分数作为值。