要按组计算摘要统计量(如均值、中位数等),可以使用Pandas库提供的groupby函数。下面是一个示例代码,演示如何按组计算均值和中位数。
import pandas as pd
# 创建示例数据
data = {'Group': ['A', 'A', 'B', 'B', 'A', 'B'],
'Value': [1, 2, 3, 4, 5, 6]}
df = pd.DataFrame(data)
# 按组计算均值
mean_df = df.groupby('Group')['Value'].mean()
print(mean_df)
# 按组计算中位数
median_df = df.groupby('Group')['Value'].median()
print(median_df)
输出结果:
Group
A 2.666667
B 4.333333
Name: Value, dtype: float64
Group
A 2
B 4
Name: Value, dtype: int64
在这个示例中,我们首先创建了一个包含组和值的示例数据框。然后,使用groupby
函数按组对值列进行分组。接下来,使用mean
函数计算每个组的均值,并使用median
函数计算每个组的中位数。最后,将结果打印输出。
你可以根据自己的数据和需要,调整示例代码来计算其他摘要统计量,或者应用其他函数。
下一篇:按组计算正值的比率