在Python中,可以使用pandas库来进行按照多个列进行分组,并对另一列进行求平均值的操作。
下面是一个示例代码,假设有一个名为df的DataFrame对象,其中包含三列数据:'A'、'B'和'C'。我们希望按照'A'和'B'列进行分组,并对'C'列进行求平均值。
import pandas as pd
# 创建一个示例DataFrame对象
data = {'A': ['group1', 'group1', 'group2', 'group1', 'group2'],
'B': ['a', 'b', 'a', 'b', 'a'],
'C': [1, 2, 3, 4, 5]}
df = pd.DataFrame(data)
# 按照'A'和'B'列进行分组,并对'C'列进行求平均值
result = df.groupby(['A', 'B'])['C'].mean()
print(result)
运行以上代码,输出结果如下:
A B
group1 a 3
b 2
group2 a 4
Name: C, dtype: int64
结果是一个Series对象,包含了按照'A'和'B'列分组后,'C'列的平均值。
下一篇:按照多个列进行排序