以下是一个示例代码来按照一个列对数据框进行分组,并根据该列添加信息:
import pandas as pd
# 创建示例数据框
data = {'姓名': ['张三', '李四', '王五', '赵六', '钱七'],
'性别': ['男', '男', '女', '女', '男'],
'年龄': [25, 30, 35, 30, 28]}
df = pd.DataFrame(data)
# 按照性别列进行分组,并根据性别列添加人数信息
df['人数'] = df.groupby('性别')['姓名'].transform('count')
# 输出结果
print(df)
输出结果为:
姓名 性别 年龄 人数
0 张三 男 25 3
1 李四 男 30 3
2 王五 女 35 2
3 赵六 女 30 2
4 钱七 男 28 3
在示例中,首先创建了一个包含姓名、性别和年龄的数据框。然后使用groupby
方法按照性别列进行分组,并使用transform
方法统计每个分组中的人数。最后,将人数信息添加到原数据框中的新列人数
中。