假设我们有一个Excel文件,其中有两列:列A是原始文本,列B是在文本中找到的重复项。我们想要将重复项添加到另一列C中。下面是一个Python代码示例:
# 导入pandas库
import pandas as pd
# 读取文件
data = pd.read_excel('file.xlsx')
# 遍历列A的每一个值
for i in range(len(data['A'])):
# 如果值在列A中重复出现
if data['A'].tolist().count(data['A'][i]) > 1:
# 将该值添加到列C中
data.loc[i, 'C'] = data['A'][i]
# 保存文件
data.to_excel('file_with_duplicates.xlsx', index=False)
该代码使用pandas库来读取Excel文件。然后它遍历每一个在列A中的值,并检查该值是否在列A中重复出现。如果是,则该值将被添加到列C中。最后,代码将更新后的数据保存到Excel文件中。
请注意,上述代码的效率可能不够高,如果您处理的数据非常大,则可能需要使用其他更快的技术。