按照它们的前缀查找重复文件（不使用哈希值）_程序开发

按照它们的前缀查找重复文件（不使用哈希值）

创始人

2024-08-25 11:30:09

0次

以下是一个使用Python实现的按照文件前缀查找重复文件的示例代码：

import os

def find_duplicate_files(directory):
    # 创建一个字典用于存储文件前缀和对应的文件路径列表
    prefix_dict = {}

    for root, dirs, files in os.walk(directory):
        for file_name in files:
            # 获取文件的前缀
            prefix = file_name.split('.')[0]

            # 如果前缀已经在字典中，则将文件路径添加到对应的列表中
            if prefix in prefix_dict:
                prefix_dict[prefix].append(os.path.join(root, file_name))
            else:
                # 如果前缀不在字典中，则创建一个新的列表，并将文件路径添加进去
                prefix_dict[prefix] = [os.path.join(root, file_name)]

    # 找到重复的文件
    duplicate_files = []
    for prefix, file_list in prefix_dict.items():
        if len(file_list) > 1:
            duplicate_files.extend(file_list)

    return duplicate_files

# 使用示例
directory = '/path/to/directory'
duplicate_files = find_duplicate_files(directory)
for file_path in duplicate_files:
    print(file_path)

上述代码首先遍历指定目录下的所有文件，将文件名的前缀作为字典的键，文件路径作为值存储到字典中。然后，检查字典中的每个键对应的文件路径列表，如果列表长度大于1，则表示存在重复文件。最后，将重复文件的路径添加到一个列表中，并返回该列表。

上一篇：按照他们的Node.js教程，在Microsoft Graph中进行POST示例

下一篇：按照它们的日期查询要分离的列

按照它们的前缀查找重复文件（不使用哈希值）

相关内容

热门资讯