可以使用Python中的pandas库来合并两个不同的数据集。具体实现步骤如下:
1.导入pandas库:
import pandas as pd
2.读取两个数据集:
df1 = pd.read_csv('dataset1.csv') df2 = pd.read_csv('dataset2.csv')
3.合并两个数据集:
merged_df = pd.merge(df1, df2, on='key')
其中,'key'是连接的关键字,可以是一个或多个列。这个关键字必须在两个数据集中都出现。
4.返回合并后的数据集:
return merged_df
完整代码示例:
import pandas as pd
def merge_datasets(dataset1, dataset2, key): df1 = pd.read_csv(dataset1) df2 = pd.read_csv(dataset2) merged_df = pd.merge(df1, df2, on=key) return merged_df
merged_dataset = merge_datasets('dataset1.csv', 'dataset2.csv', 'key')