以下是一个示例代码,展示了如何按照特定优先级合并两个数据集。
import pandas as pd
# 创建两个示例数据集
df1 = pd.DataFrame({'ID': [1, 2, 3],
'Value1': [10, 20, 30]})
df2 = pd.DataFrame({'ID': [2, 3, 4],
'Value2': [40, 50, 60]})
# 按照特定优先级合并数据集
df_merged = pd.merge(df1, df2, on='ID', how='outer')
df_merged['Value'] = df_merged['Value2'].fillna(df_merged['Value1'])
df_merged = df_merged.drop(['Value1', 'Value2'], axis=1)
print(df_merged)
输出结果如下:
ID Value
0 1 10.0
1 2 40.0
2 3 50.0
3 4 60.0
在这个示例中,我们首先使用pd.merge()
函数按照ID
列合并了两个数据集。然后,我们使用fillna()
函数将Value2
列中的缺失值用Value1
列中的值进行填充。最后,我们删除了Value1
和Value2
列,只保留了合并后的Value
列。