BeautifulSoup: 合并表格并导出为 .csv 文件
创始人
2024-11-27 11:00:08
0

以下是使用BeautifulSoup库合并表格并导出为.csv文件的示例代码:

from bs4 import BeautifulSoup
import csv

# 读取HTML文件
with open('input.html') as file:
    soup = BeautifulSoup(file, 'html.parser')

# 查找所有表格
tables = soup.find_all('table')

# 创建CSV文件
with open('output.csv', 'w', newline='') as file:
    writer = csv.writer(file)

    # 遍历每个表格
    for table in tables:
        # 查找所有行
        rows = table.find_all('tr')

        # 遍历每一行
        for row in rows:
            # 查找所有单元格
            cells = row.find_all(['th', 'td'])

            # 提取每个单元格的文本内容
            data = [cell.get_text(strip=True) for cell in cells]

            # 写入CSV文件
            writer.writerow(data)

在上述代码中,我们首先使用BeautifulSoup库读取HTML文件,并找到所有的表格。然后,我们创建一个CSV文件,并使用csv.writer对象将表格数据写入CSV文件。

在遍历每个表格时,我们首先找到所有的行,然后遍历每一行。对于每一行,我们找到所有的单元格,并提取其文本内容。最后,我们使用writer.writerow()方法将每一行的数据写入CSV文件。

请确保将输入HTML文件的名称替换为实际文件的名称,并将输出CSV文件的名称替换为您想要的名称。

相关内容

热门资讯

六分钟了解!雀神辅助器免费下载... 六分钟了解!雀神辅助器免费下载(辅助挂)竟然真的有挂(有挂神器)-哔哩哔哩;人气非常高,ai更新快且...
玩家必用!wepoke防外挂!... 玩家必用!wepoke防外挂!确实是真的有挂((2021已更新))(哔哩哔哩)1、这是跨平台的wep...
九分钟普及!wpk德州透视辅助... 1、九分钟普及!wpk德州透视辅助(透视)软件透明挂((2025已更新))(哔哩哔哩);详细教程。2...
重大发现!广东雀神免费智能辅助... 重大发现!广东雀神免费智能辅助下载(辅助挂)果真真的有挂(真实有挂)-哔哩哔哩;是一款可以让一直输的...
研究成果!aapoker辅助软... 研究成果!aapoker辅助软件!竟然真的有挂((2020已更新))(哔哩哔哩)是一款可以让一直输的...
十分钟普及!扑克王辅助工具(辅... 十分钟普及!扑克王辅助工具(辅助挂)辅助透视((2022已更新))(哔哩哔哩)是一款可以让一直输的玩...
透明教学!雀神广东麻雀正规(辅... 透明教学!雀神广东麻雀正规(辅助挂)原来是真的有挂(有挂技术)-哔哩哔哩;一、雀神广东麻雀正规AI软...
盘点一款!德州之星辅助透视!其... 盘点一款!德州之星辅助透视!其实真的有挂((2022已更新))(哔哩哔哩)是一款可以让一直输的玩家,...
7分钟普及!EV扑克辅助软件(... 您好,EV扑克这款游戏可以开挂的,确实是有挂的,需要了解加微【439369440】很多玩家在这款游戏...
玩家攻略推荐!雀神麻将辅牌器购... 玩家攻略推荐!雀神麻将辅牌器购买(辅助挂)果真真的有挂(有挂详细)-哔哩哔哩1、完成雀神麻将辅牌器购...