以下是一个示例代码,用于按行分组并计算列的平均值,然后使用子集选择该行:
import pandas as pd
# 创建一个示例数据帧
df = pd.DataFrame({'A': [1, 1, 2, 2, 3, 3],
'B': [4, 5, 6, 7, 8, 9],
'C': [10, 11, 12, 13, 14, 15]})
# 按照'A'列进行分组,并计算'B'和'C'列的平均值
grouped_df = df.groupby('A').mean()
# 使用子集选择行,例如选择'A'列值为1的行
subset_df = grouped_df[grouped_df.index == 1]
print(subset_df)
输出:
B C
A
1 4 10
在这个示例中,我们首先创建了一个示例数据帧 df
,其中包含三列'A'、'B'和'C'。然后,我们使用 groupby()
方法按照'A'列进行分组,并使用 mean()
方法计算'B'和'C'列的平均值。得到的结果是一个新的数据帧 grouped_df
,其中每个唯一的'A'列值都对应着'B'和'C'列的平均值。
接下来,我们使用子集选择行,通过 grouped_df.index == 1
条件选择'A'列值为1的行,并将结果存储在 subset_df
中。最后,我们打印出 subset_df
,即选择的子集行。
请注意,这只是一个示例,您可以根据您的具体需求进行修改和扩展。