使用Python中的pandas库进行操作
import pandas as pd
# 构造示例数据
data = {'id': [1, 1, 1, 2, 2, 2, 3, 3, 3],
'date': ['2022-01-01', '2022-01-02', '2022-01-03', '2022-01-01', '2022-01-02', '2022-01-03', '2022-01-01', '2022-01-02', '2022-01-03']}
df = pd.DataFrame(data)
# 对id和日期进行排序
df = df.sort_values(['id', 'date'])
# 获取每个id的前两个日期
df = df.groupby('id').head(2)
# 打印结果
print(df)
运行结果:
id date
0 1 2022-01-01
1 1 2022-01-02
3 2 2022-01-01
4 2 2022-01-02
6 3 2022-01-01
7 3 2022-01-02