要按照一个变量进行分组,并显示多个 SQL,可以使用以下代码示例来解决:
import pandas as pd
# 假设有一个包含学生姓名和成绩的数据集
data = {'姓名': ['张三', '李四', '王五', '张三', '李四', '王五'],
'科目': ['数学', '数学', '数学', '语文', '语文', '语文'],
'成绩': [90, 85, 95, 80, 75, 85]}
df = pd.DataFrame(data)
# 根据姓名进行分组,并显示每个组的平均成绩和总成绩
grouped = df.groupby('姓名')
for name, group in grouped:
avg_score = group['成绩'].mean()
total_score = group['成绩'].sum()
print(f"姓名: {name}")
print(f"平均成绩: {avg_score}")
print(f"总成绩: {total_score}")
print()
输出结果:
姓名: 李四
平均成绩: 80.0
总成绩: 160
姓名: 张三
平均成绩: 85.0
总成绩: 170
姓名: 王五
平均成绩: 90.0
总成绩: 180
以上代码使用 Pandas 库来处理数据集。首先,创建一个包含学生姓名、科目和成绩的数据字典。然后,通过 pd.DataFrame()
函数将数据字典转换为数据帧。接下来,使用 groupby()
函数根据姓名进行分组。
然后,使用 for
循环遍历每个分组。在循环中,可以根据需要进行其他操作,例如计算平均成绩和总成绩。在示例中,使用 mean()
函数计算平均成绩,使用 sum()
函数计算总成绩。
最后,通过 print()
函数将结果打印出来。