以下是一个示例代码,展示如何按照多个键对字典列表进行分组和聚合:
from collections import defaultdict
# 定义字典列表
data = [
{'name': 'Alice', 'age': 25, 'gender': 'female', 'score': 80},
{'name': 'Bob', 'age': 30, 'gender': 'male', 'score': 90},
{'name': 'Alice', 'age': 25, 'gender': 'female', 'score': 95},
{'name': 'Bob', 'age': 30, 'gender': 'male', 'score': 85},
{'name': 'Charlie', 'age': 35, 'gender': 'male', 'score': 75},
]
# 定义分组和聚合的键
keys = ['name', 'age', 'gender']
# 定义一个defaultdict来存储分组和聚合的结果
result = defaultdict(list)
# 按照多个键进行分组
for d in data:
group_key = tuple(d[key] for key in keys)
result[group_key].append(d)
# 对每个分组进行聚合
for group_key, group_data in result.items():
# 计算平均分数
total_score = sum(d['score'] for d in group_data)
average_score = total_score / len(group_data)
# 打印结果
print(f"Group: {group_key}, Average Score: {average_score}")
for d in group_data:
print(d)
print()
这段代码首先定义了一个字典列表 data
,包含了一些学生的信息。然后定义了要按照哪些键进行分组和聚合的 keys
列表。
接下来,使用 defaultdict
来创建一个空的字典 result
,用于存储分组和聚合的结果。然后使用一个循环遍历字典列表 data
,对每个字典根据 keys
列表中的键值进行分组,并将分组结果存入 result
字典中。
最后,使用另一个循环遍历 result
字典中的每个分组,计算每组学生的平均分数,并打印出来。同时,也打印出了每个分组内的学生详细信息。