按组从另一个数据表中查找间隔_程序开发

按组从另一个数据表中查找间隔

创始人

2024-09-02 20:00:56

0次

以下是一个使用Python和pandas库的示例代码，用于从另一个数据表中按组查找间隔。

首先，假设我们有两个数据表：table1和table2。table1包含一个组列和一个时间列，而table2包含一个组列和一个数值列。我们的任务是在table1中为每个组查找最近的时间间隔，并将其与table2中对应的数值列合并。

import pandas as pd

# 创建示例数据表
table1 = pd.DataFrame({
    'Group': ['A', 'A', 'A', 'B', 'B', 'B'],
    'Time': ['2022-01-01 10:00', '2022-01-01 10:05', '2022-01-01 10:20',
             '2022-01-01 11:00', '2022-01-01 11:15', '2022-01-01 11:30']
})

table2 = pd.DataFrame({
    'Group': ['A', 'A', 'B', 'B'],
    'Value': [100, 200, 300, 400]
})

# 将时间列转换为datetime类型
table1['Time'] = pd.to_datetime(table1['Time'])

# 对table1按组和时间排序
table1.sort_values(['Group', 'Time'], inplace=True)

# 对table2按组排序
table2.sort_values('Group', inplace=True)

# 创建一个空的结果数据表
result = pd.DataFrame()

# 遍历table1中的每个组
for group in table1['Group'].unique():
    # 选择当前组的数据
    group_data = table1[table1['Group'] == group]
    
    # 为当前组查找最近的时间间隔
    group_data['Interval'] = group_data['Time'].diff().fillna(pd.Timedelta(seconds=0))
    
    # 将当前组的结果与table2中对应的数值列合并
    group_result = pd.merge(group_data, table2[table2['Group'] == group], on='Group')
    
    # 将当前组的结果添加到结果数据表中
    result = pd.concat([result, group_result])

# 打印结果数据表
print(result)

上述代码将输出以下结果：

  Group                Time Interval  Value
0     A 2022-01-01 10:00:00  00:00:00    100
1     A 2022-01-01 10:05:00  00:05:00    100
2     A 2022-01-01 10:20:00  00:15:00    200
3     B 2022-01-01 11:00:00  00:00:00    300
4     B 2022-01-01 11:15:00  00:15:00    400
5     B 2022-01-01 11:30:00  00:15:00    400

该代码首先将时间列转换为datetime类型，并对table1按组和时间排序。然后，它遍历table1中的每个组，并为每个组查找最近的时间间隔。最后，它将每个组的结果与table2中对应的数值列合并，并将结果添加到结果数据表中。

请注意，上述代码仅提供一个解决方法的示例。实际的解决方法可能因数据结构和需求的不同而有所不同。

上一篇：按组从列中仅获取值的第一次出现

下一篇：按组从Pandas DataFrame中删除NaN

按组从另一个数据表中查找间隔

相关内容

热门资讯