在Python中,可以使用pandas库来进行按照满足条件的分组ID计算多列观测值的数量和平均值。下面是一个示例代码:
import pandas as pd
# 创建示例数据
data = {'GroupID': ['A', 'A', 'B', 'B', 'A', 'B'],
'Value1': [1, 2, 3, 4, 5, 6],
'Value2': [10, 20, 30, 40, 50, 60]}
df = pd.DataFrame(data)
# 按照GroupID分组,并计算每个分组的数量和平均值
result = df.groupby('GroupID').agg({'Value1': ['count', 'mean'], 'Value2': ['count', 'mean']})
print(result)
输出结果为:
Value1 Value2
count mean count mean
GroupID
A 3 2.67 3 26.67
B 3 4.33 3 43.33
在这个示例中,我们创建了一个包含GroupID、Value1和Value2列的DataFrame。然后,我们使用groupby方法按照GroupID进行分组,并使用agg方法计算每个分组的数量和平均值。agg方法接受一个字典作为参数,其中键是要计算的列名,值是要应用的聚合函数。在这个例子中,我们计算了Value1和Value2列的数量和平均值。最后,我们打印出结果。