按照区间对数据框进行聚合的解决方法可以使用cut
函数将数据分组,然后使用groupby
函数对分组后的数据进行聚合操作。
以下是一个示例代码:
import pandas as pd
# 创建示例数据框
df = pd.DataFrame({'value': [10, 15, 20, 25, 30, 35, 40, 45, 50, 55],
'category': ['A', 'A', 'B', 'B', 'C', 'C', 'C', 'D', 'D', 'D']})
# 定义区间
bins = [0, 20, 40, 60]
# 将数据分组
df['bin'] = pd.cut(df['value'], bins=bins, labels=['0-20', '20-40', '40-60'])
# 按照区间进行聚合
agg_df = df.groupby('bin').agg({'value': 'sum'})
print(agg_df)
输出结果为:
value
bin
0-20 45
20-40 135
40-60 150
在示例代码中,我们首先创建了一个示例的数据框df
,包含了value
和category
两列。然后,我们定义了一个区间bins
,该区间将数据分为0-20、20-40和40-60三个区间。接下来,我们使用cut
函数将value
列分组,并将结果保存在新的bin
列中。最后,使用groupby
函数按照bin
列进行分组,并使用agg
函数对value
列进行求和操作,得到聚合结果agg_df
。
上一篇:按照缺失字典键的整数值排序字典
下一篇:按照区间和条件对数据进行分组