以下是一个示例代码,展示了如何根据某些观测值生成变量的组生成变量:
import pandas as pd
# 创建一个示例数据集
data = {'group': ['A', 'B', 'A', 'B', 'A', 'B'],
'value': [1, 2, 3, 4, 5, 6]}
df = pd.DataFrame(data)
# 使用groupby函数按照组进行分组,并计算每个组的平均值
group_means = df.groupby('group')['value'].mean()
# 将每个组的平均值作为新的变量添加到原始数据集中
df['group_mean'] = df['group'].map(group_means)
print(df)
输出结果如下:
group value group_mean
0 A 1 3.000000
1 B 2 4.000000
2 A 3 3.000000
3 B 4 4.000000
4 A 5 3.000000
5 B 6 4.000000
在上面的示例中,我们首先创建了一个包含组和值的示例数据集。然后,使用groupby
函数按照组进行分组,并计算每个组的平均值。最后,我们使用map
函数将每个组的平均值映射到原始数据集的group_mean
列中。这样,就根据某些观测值生成了变量的组生成变量。
上一篇:按照某些标准对索引的子集进行排序
下一篇:按照某些规则生成实例类