以下是一个示例代码,用于按组计算频率:
import pandas as pd
# 创建一个包含组和值的DataFrame
df = pd.DataFrame({'Group': ['A', 'A', 'A', 'B', 'B', 'C'],
'Value': [1, 2, 2, 3, 3, 3]})
# 按组计算频率
freq_df = df.groupby(['Group', 'Value']).size().reset_index(name='Frequency')
在上面的示例中,我们创建了一个包含组和值的DataFrame。然后,我们使用groupby
函数按组和值对DataFrame进行分组。接下来,我们使用size
函数计算每个组和值的频率,并使用reset_index
函数重置索引并将频率命名为'Frequency'。最后,我们得到了一个包含按组计算的频率的新DataFrame freq_df
。
运行上面的代码后,freq_df
的输出如下:
Group Value Frequency
0 A 1 1
1 A 2 2
2 B 3 2
3 C 3 1
这表示在组A中,值1出现1次,值2出现2次;在组B中,值3出现2次;在组C中,值3出现1次。
希望这个示例能帮助到您!
上一篇:按组计算平均值时的“NA问题”
下一篇:按组计算缺失值的总数?