下面是一个示例代码,演示了如何按组和子组进行汇总并根据条件显示数据。
import pandas as pd
# 创建一个示例数据集
data = {'Group': ['A', 'A', 'B', 'B', 'C', 'C'],
'Subgroup': ['X', 'Y', 'X', 'Y', 'X', 'Y'],
'Value': [1, 2, 3, 4, 5, 6]}
df = pd.DataFrame(data)
# 按组和子组进行汇总并计算总和
summary = df.groupby(['Group', 'Subgroup']).sum()
# 根据条件筛选数据
filtered_data = summary[summary['Value'] > 5]
print(filtered_data)
输出结果为:
Value
Group Subgroup
C Y 6
在示例代码中,首先创建了一个包含组、子组和值的示例数据集。然后使用groupby
方法按组和子组进行分组,并使用sum
方法计算每个组和子组的总和。接下来,使用条件过滤器筛选出值大于5的数据,并将结果打印输出。
这只是一个简单的示例,你可以根据自己的需求进行修改和扩展。