可以使用Python的pandas库来解决这个问题。以下是一个示例代码:
import pandas as pd
# 创建示例数据
data = {'ID': [1, 2, 3, 4, 5],
'日期': ['2021-01-01', '2021-02-01', '2021-01-01', '2021-03-01', '2021-02-01']}
df = pd.DataFrame(data)
# 将日期列转换为时间类型
df['日期'] = pd.to_datetime(df['日期'])
# 按最新日期选择ID
df_latest = df.sort_values('日期', ascending=False).drop_duplicates('ID')
# 按ID进行分组
df_grouped = df_latest.groupby('ID')
# 打印结果
for group, data in df_grouped:
print(f"ID: {group}")
print(data)
print("--------------------")
运行以上代码,将会按最新日期选择ID,并按ID进行分组。每个分组的结果将会被打印出来。