以下是一个示例代码,演示如何按照两个变量进行分组,并计算每个分组的百分比变化。
import pandas as pd
# 创建一个示例数据集
data = {'group': ['A', 'A', 'A', 'B', 'B', 'B'],
'variable1': [10, 20, 30, 40, 50, 60],
'variable2': [100, 200, 300, 400, 500, 600]}
df = pd.DataFrame(data)
# 按照group进行分组,并计算每个分组中variable1和variable2的变化百分比
df['percentage_change'] = df.groupby('group').apply(lambda x: x['variable2'].pct_change() * 100)
print(df)
输出结果如下:
group variable1 variable2 percentage_change
0 A 10 100 NaN
1 A 20 200 100.000000
2 A 30 300 50.000000
3 B 40 400 NaN
4 B 50 500 25.000000
5 B 60 600 20.000000
在上述示例中,我们使用pandas库对数据进行处理。首先,我们创建了一个包含group、variable1和variable2的示例数据集。然后,我们使用groupby()
函数按照group进行分组。接下来,我们使用apply()
函数和lambda表达式,计算每个分组中variable2的变化百分比,并将结果存储在新的列percentage_change中。最后,我们打印输出整个数据集。请注意,在计算变化百分比时,第一个数据点的百分比变化被设置为NaN。