在Python中,可以使用pandas库来按照每个客户的首个订单筛选数据框。下面是一个示例代码:
import pandas as pd
# 创建示例数据框
data = {'客户ID': [1, 1, 2, 3, 3, 3],
'订单ID': [101, 102, 201, 301, 302, 303],
'订单金额': [100, 150, 200, 50, 100, 150]}
df = pd.DataFrame(data)
# 按照客户ID和订单ID排序数据框
df_sorted = df.sort_values(['客户ID', '订单ID'])
# 使用drop_duplicates方法选择每个客户的首个订单
df_filtered = df_sorted.drop_duplicates(subset='客户ID', keep='first')
# 打印筛选后的数据框
print(df_filtered)
输出结果:
客户ID 订单ID 订单金额
0 1 101 100
2 2 201 200
3 3 301 50
在上面的示例中,首先我们创建了一个示例数据框。然后,我们使用sort_values
方法按照客户ID和订单ID对数据框进行排序,以确保相同客户的订单按照订单ID的顺序排列。接下来,我们使用drop_duplicates
方法选择每个客户的首个订单,并将结果保存在df_filtered
中。最后,我们打印筛选后的数据框。