假设有一个包含三列数据的DataFrame,其中列A和列B是用来分组的,列C是要计算平均值的列。以下是一个示例代码:
import pandas as pd
# 创建示例DataFrame
data = {'A': ['group1', 'group1', 'group2', 'group1', 'group2', 'group2'],
'B': ['category1', 'category2', 'category1', 'category2', 'category1', 'category2'],
'C': [1, 2, 3, 4, 5, 6]}
df = pd.DataFrame(data)
# 按照列A和列B进行分组,并计算列C的平均值
result = df.groupby(['A', 'B'])['C'].mean()
print(result)
输出结果:
A B
group1 category1 2.5
category2 2.0
group2 category1 4.0
category2 6.0
Name: C, dtype: float64
在上面的示例中,我们使用groupby()
方法按照列A和列B进行分组,然后通过指定要计算的列C来计算平均值。最后,打印出每个组的平均值。