按照筛选后的pandas DataFrame 进行分组，并选择每个组中的最新数据。_程序开发

按照筛选后的pandas DataFrame 进行分组，并选择每个组中的最新数据。

创始人

2024-08-25 08:00:08

0次

要按照筛选后的pandas DataFrame 进行分组，并选择每个组中的最新数据，可以按照以下步骤进行操作：

使用筛选条件对DataFrame进行筛选。假设我们的DataFrame为df，筛选条件为column_name > value，可以使用以下代码进行筛选：

filtered_df = df[df['column_name'] > value]

将筛选后的DataFrame按照分组列进行分组。假设我们要按照'group_column'列进行分组，可以使用以下代码进行分组：

grouped_df = filtered_df.groupby('group_column')

对每个分组选择最新的数据。可以使用grouped_df的apply方法结合lambda函数来选择最新的数据。假设我们要选择'日期'列最大的数据作为最新数据，可以使用以下代码选择最新数据：

newest_data = grouped_df.apply(lambda x: x[x['日期'] == x['日期'].max()])

最终的newest_data是一个包含每个分组最新数据的DataFrame。

完整的代码示例：

import pandas as pd

# 创建一个DataFrame
data = {'group_column': ['A', 'A', 'B', 'B'],
        'column_name': [10, 15, 20, 25],
        '日期': ['2021-01-01', '2021-01-02', '2021-01-01', '2021-01-02']}
df = pd.DataFrame(data)

# 筛选条件
value = 12

# 筛选DataFrame
filtered_df = df[df['column_name'] > value]

# 按照分组列进行分组
grouped_df = filtered_df.groupby('group_column')

# 选择每个分组中最新的数据
newest_data = grouped_df.apply(lambda x: x[x['日期'] == x['日期'].max()])

print(newest_data)

输出结果：

  group_column  column_name          日期
1            A           15  2021-01-02
3            B           25  2021-01-02

上一篇：按照shadow-cljs文档观察应用程序后，“Helloworld将在哪里打印？

下一篇：按照筛选列进行分组

按照筛选后的pandas DataFrame 进行分组，并选择每个组中的最新数据。

相关内容

热门资讯