编写Python脚本将文件夹中的RTF文件合并成带有文件名单独列的CSV文件。
创始人
2024-12-05 15:00:41
0

可以使用Python的pandas和pyth工具包来处理RTF文件和CSV文件的读写,以下是示例代码:

import os
import pandas as pd
import pyth.plugins.rtf15.reader
from pyth.plugins.plaintext.writer import PlaintextWriter

rtf_folder = "/path/to/rtf/folder"
csv_file = "/path/to/csv/file.csv"

# 获取文件夹中的所有RTF文件名
rtf_files = [f for f in os.listdir(rtf_folder) if f.endswith('.rtf')]

# 循环处理每个RTF文件
rows = []
for rtf_file in rtf_files:
    # 读取RTF文件并转换成纯文本格式
    rtf_path = os.path.join(rtf_folder, rtf_file)
    with open(rtf_path, "r") as rtf_file:
        rtf_content = rtf_file.read()
    rtf_doc = pyth.plugins.rtf15.reader.read(rtf_content)
    plaintext_writer = PlaintextWriter()
    plain_text = plaintext_writer.write(rtf_doc).getvalue()

    # 将文件名和文本内容存储到一行数据中
    row = {'filename': rtf_file, 'content': plain_text}
    rows.append(row)

# 将所有行数据装载到pandas的DataFrame中,并将DataFrame的数据保存到CSV文件中
df = pd.DataFrame(rows)
df.to_csv(csv_file, index=False)

运行以上代码,将会读取RTF文件夹中的所有RTF文件,将每个文件的文件名和内容存储到DataFrame中,并将DataFrame的数据写入到CSV文件中。生成的CSV文件将包括两列数据:文件名和RTF文件中的文本内容。

相关内容

热门资讯

九分钟了解!情怀古诗词有没有挂... 九分钟了解!情怀古诗词有没有挂,微信开心跑得快辅助器,可靠技巧(有挂科普);1、进入到微信开心跑得快...
4分钟了解!四人斗地主有猫腻吗... 4分钟了解!四人斗地主有猫腻吗,天天开心王国有没有外挂,必胜教程(有挂规律)1、任何天天开心王国有没...
三分钟了解!牵手跑得快小程序怎... 三分钟了解!牵手跑得快小程序怎么拿好牌,吉祥麻将软件黑科技,揭秘教程(有挂工具);牵手跑得快小程序怎...
四分钟了解!天天斗牌大联盟有外... 四分钟了解!天天斗牌大联盟有外 挂吗,逸乐麻将有挂吗,细节揭秘(有挂解说)小薇(透视辅助)致您一封信...
7分钟了解!雀神麻将有没有挂到... 7分钟了解!雀神麻将有没有挂到底有挂吗,家家乐牌吧发牌是不是有规律,透明教程(有挂普及);运家家乐牌...
4分钟了解!聚友互娱辅助软件下... 4分钟了解!聚友互娱辅助软件下载,jj斗地主哪里买,揭秘攻略(有挂技巧);1、每一步都需要思考,不同...
8分钟了解!开心跑得快好牌,八... 8分钟了解!开心跑得快好牌,八闽十三水辅助器,第三方教程(有挂实操)1、八闽十三水辅助器系统规律教程...
三分钟了解!雀友会有挂吗,聚乐... 三分钟了解!雀友会有挂吗,聚乐麻将有挂吗是真的吗,微扑克教程(有挂科普)1、玩家可以在聚乐麻将有挂吗...
十分钟了解!兄弟福建十三水的发... 十分钟了解!兄弟福建十三水的发牌机制是什么,中至吉安王炸发牌规律,透视教程(有挂总结);1、兄弟福建...
七分钟了解!家家乐牌吧发牌是不... 七分钟了解!家家乐牌吧发牌是不是有规律,天天爱掼蛋有木有外挂,安装教程(有挂黑科技)1、用户打开应用...