要按照分组后,在列中创建数值,可以使用pandas库来完成。
首先,我们需要使用groupby()
函数对数据进行分组。然后,可以使用transform()
函数来对每个分组进行操作,并将结果放入新的列中。
下面是一个示例代码,假设我们有一个名为df
的DataFrame,其中包含group
和value
两列:
import pandas as pd
# 创建示例数据
data = {'group': ['A', 'A', 'B', 'B', 'C', 'C'],
'value': [1, 2, 3, 4, 5, 6]}
df = pd.DataFrame(data)
# 按照group列进行分组,并在每个分组中创建新的列mean_value,计算每个分组的平均值
df['mean_value'] = df.groupby('group')['value'].transform('mean')
print(df)
输出结果:
group value mean_value
0 A 1 1.5
1 A 2 1.5
2 B 3 3.5
3 B 4 3.5
4 C 5 5.5
5 C 6 5.5
在上述示例中,我们按照group
列分组,并使用transform()
函数计算每个分组的平均值,并将结果存储在新的列mean_value
中。