你可以使用pandas库来按组创建一个包含平均值的列。下面是一个示例代码:
import pandas as pd
# 创建一个包含数据的DataFrame
data = {'Group': ['A', 'A', 'B', 'B'],
'Value': [1, 2, 3, 4]}
df = pd.DataFrame(data)
# 按组计算平均值并创建一个新的列
df['Average'] = df.groupby('Group')['Value'].transform('mean')
# 打印结果
print(df)
运行以上代码,你会得到以下输出结果:
Group Value Average
0 A 1 1.5
1 A 2 1.5
2 B 3 3.5
3 B 4 3.5
在这个示例中,我们首先创建了一个包含两列的DataFrame,其中一列是Group,另一列是Value。然后,我们使用groupby()
方法按照Group列的值来分组数据。接着,我们使用transform('mean')
方法计算每个组的平均值,并将结果存储在一个新的列中。最后,我们打印出结果DataFrame。
注意,这里的平均值计算是针对每个组内的数值进行的。如果你想要计算整个数据集的平均值,而不是每个组的平均值,你可以使用mean()
方法而不是transform('mean')
方法。