以下是一种可能的解决方法,使用Python的os和pandas库:
import os
import pandas as pd
def convert_csv_gz_to_csv(folder_path):
for root, dirs, files in os.walk(folder_path):
for file in files:
if file.endswith('.csv.gz'):
gz_path = os.path.join(root, file)
csv_path = os.path.join(root, file[:-3]) + '.csv'
df = pd.read_csv(gz_path, compression='gzip')
df.to_csv(csv_path, index=False)
os.remove(gz_path) # 可选:如果要删除原始的csv.gz文件
# 使用示例
folder_path = '/path/to/your/folder'
convert_csv_gz_to_csv(folder_path)
这个函数convert_csv_gz_to_csv
接受一个文件夹路径作为参数,并会遍历该文件夹下的所有子文件夹。对于每个文件,如果文件名以.csv.gz
结尾,它会先读取gzip压缩的CSV文件,然后将其转换为普通的CSV文件,并保存到相同的文件夹路径下。最后,如果需要,它会删除原始的gzip压缩文件。
上一篇:遍历多个表以查看是否存在某一列?
下一篇:遍历多个CSV文件