以下是一个示例代码,演示了如何按最新元素和更新进行分组:
from itertools import groupby
# 原始数据
data = [
{'key': 'A', 'value': 1, 'updated': '2021-01-01'},
{'key': 'B', 'value': 2, 'updated': '2021-01-01'},
{'key': 'A', 'value': 3, 'updated': '2021-02-01'},
{'key': 'B', 'value': 4, 'updated': '2021-02-01'},
{'key': 'A', 'value': 5, 'updated': '2021-03-01'},
{'key': 'B', 'value': 6, 'updated': '2021-03-01'},
]
# 按最新元素和更新进行分组
data.sort(key=lambda x: (x['key'], x['updated'])) # 先按键排序,再按更新排序
groups = []
for key, group in groupby(data, key=lambda x: x['key']):
group = list(group)
latest_element = group[-1]
groups.append({'key': key, 'value': latest_element['value'], 'updated': latest_element['updated']})
# 打印结果
for group in groups:
print(group)
输出结果为:
{'key': 'A', 'value': 5, 'updated': '2021-03-01'}
{'key': 'B', 'value': 6, 'updated': '2021-03-01'}
在这个示例中,我们首先根据键和更新日期对原始数据进行排序,以确保每个组内的元素按更新日期的升序排列。然后,我们使用 itertools.groupby
函数按键进行分组。对于每个组,我们取最后一个元素作为最新元素,并构建一个新的字典对象来存储键、最新值和最新更新日期。最后,我们打印出结果。
下一篇:按最新值分组的SQL