以下是一个使用Python实现的按照文件前缀查找重复文件的示例代码:
import os
def find_duplicate_files(directory):
# 创建一个字典用于存储文件前缀和对应的文件路径列表
prefix_dict = {}
for root, dirs, files in os.walk(directory):
for file_name in files:
# 获取文件的前缀
prefix = file_name.split('.')[0]
# 如果前缀已经在字典中,则将文件路径添加到对应的列表中
if prefix in prefix_dict:
prefix_dict[prefix].append(os.path.join(root, file_name))
else:
# 如果前缀不在字典中,则创建一个新的列表,并将文件路径添加进去
prefix_dict[prefix] = [os.path.join(root, file_name)]
# 找到重复的文件
duplicate_files = []
for prefix, file_list in prefix_dict.items():
if len(file_list) > 1:
duplicate_files.extend(file_list)
return duplicate_files
# 使用示例
directory = '/path/to/directory'
duplicate_files = find_duplicate_files(directory)
for file_path in duplicate_files:
print(file_path)
上述代码首先遍历指定目录下的所有文件,将文件名的前缀作为字典的键,文件路径作为值存储到字典中。然后,检查字典中的每个键对应的文件路径列表,如果列表长度大于1,则表示存在重复文件。最后,将重复文件的路径添加到一个列表中,并返回该列表。