可以使用pandas库来实现按性别分组并统计身高列中的缺失值数量。以下是一个示例代码:
import pandas as pd
# 创建示例数据
data = {'性别': ['男', '女', '男', '女', '男', '男'],
'身高': [175, 160, None, 165, 180, None]}
df = pd.DataFrame(data)
# 按性别分组并统计身高列中的缺失值数量
missing_values = df.groupby('性别')['身高'].apply(lambda x: x.isnull().sum())
print(missing_values)
输出结果为:
性别
女 0
男 2
Name: 身高, dtype: int64
这个示例中,我们首先创建了一个包含性别和身高的示例数据。然后使用groupby
方法按性别分组,再通过apply
方法对每个组的身高列进行操作。在apply
方法中,我们使用lambda
函数来统计每个组身高列中的缺失值数量,通过isnull().sum()
来计算缺失值的数量。最后,打印输出结果。
上一篇:按性别拆分姓名列表
下一篇:按性别和年龄对多维数组进行排序