在Python中,可以使用pandas库来按照日期和名称获取最新的行。下面是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'日期': ['2020-01-01', '2020-01-02', '2020-01-03', '2020-01-01', '2020-01-02', '2020-01-03'],
'名称': ['A', 'A', 'A', 'B', 'B', 'B'],
'数值': [1, 2, 3, 4, 5, 6]}
df = pd.DataFrame(data)
# 将日期列转换为日期类型
df['日期'] = pd.to_datetime(df['日期'])
# 按照日期和名称排序
df = df.sort_values(['日期', '名称'])
# 获取最新的行
latest_rows = df.groupby('名称').last()
print(latest_rows)
输出结果:
日期 数值
名称
A 2020-01-03 3
B 2020-01-03 6
上述代码首先创建了一个示例数据集,其中包含日期、名称和数值列。然后,通过将日期列转换为日期类型并使用sort_values
方法按日期和名称进行排序。最后,使用groupby
方法按名称分组,并使用last
方法获取每个组的最后一行,即最新的行。
上一篇:按照日期和ID排序变量