以下是一个示例代码,展示如何按照某列的重复值合并一个数据框并移除NaN值:
import pandas as pd
# 创建示例数据框
data = {'列1': ['A', 'A', 'B', 'B', 'C'],
'列2': [1, 2, 3, pd.NA, 5],
'列3': [6, 7, pd.NA, 9, 10]}
df = pd.DataFrame(data)
# 按照列1的重复值合并数据框,并移除NaN值
merged_df = df.groupby('列1').first().reset_index()
# 打印合并后的数据框
print(merged_df)
输出结果为:
列1 列2 列3
0 A 1 6.0
1 B 3 9.0
2 C 5 10.0
在这个示例中,我们使用groupby()
函数按照列1的重复值进行分组。然后,我们使用first()
函数选择每个分组中的第一个非NaN值,并用reset_index()
函数重置索引。最后,我们得到了一个合并后的数据框merged_df
,其中包含每个分组的第一个非NaN值。