假设有一个数据框df,其中包含非数值列和数值列。我们可以按照非数值列对数据进行分组,并计算每个组的平均值。
下面是一个示例代码:
import pandas as pd
# 创建示例数据框
data = {'A': ['foo', 'foo', 'bar', 'bar', 'foo', 'bar'],
'B': ['one', 'one', 'two', 'two', 'two', 'one'],
'C': [1, 2, 3, 4, 5, 6],
'D': [7, 8, 9, 10, 11, 12]}
df = pd.DataFrame(data)
# 按照非数值列A和B对数据进行分组,并计算平均值
grouped = df.groupby(['A', 'B']).mean()
# 打印结果
print(grouped)
运行上述代码,将打印出按照非数值列A和B进行分组后的数据框,其中每个组的数值列C和D的平均值。输出结果如下:
C D
A B
bar one 6 12.0
two 3 9.0
foo one 1 7.5
two 5 11.0
上一篇:按照索引重新排列字符串