以下是一个示例代码,用于按组计算缺失值的总数:
import pandas as pd
# 创建一个包含缺失值的示例数据集
data = {'Group': ['A', 'A', 'B', 'B', 'B', 'C'],
'Value': [1, None, 3, None, 5, 6]}
df = pd.DataFrame(data)
# 按组计算缺失值的总数
missing_count = df.groupby('Group')['Value'].apply(lambda x: x.isnull().sum()).reset_index(name='Missing Count')
print(missing_count)
输出结果如下:
Group Missing Count
0 A 1
1 B 2
2 C 0
在这个示例中,我们首先创建了一个包含缺失值的数据集。然后,我们使用groupby
函数按照Group
列分组,并使用apply
函数在每个组上应用一个lambda函数。这个lambda函数计算每个组中缺失值的数量,通过x.isnull().sum()
实现。最后,我们使用reset_index
函数将结果重置为一个新的DataFrame,并将列名设置为Missing Count
。
上一篇:按组计算频率