使用 Beautiful Soup 库解析 HTML 页面,找到目标表格的标签(如 注意:以上示例仅适用于简单的表格结构,如果表格中包含合并单元格或嵌套表格等复杂结构,可能需要进行更多的标签选择和处理。)和每一行的标签(如
),然后遍历每个标签中的每个单元格(如 )来获取数据。以下是一个示例代码:
from bs4 import BeautifulSoup
import requests
url = 'https://example.com'
# 发送 GET 请求并获取响应内容
response = requests.get(url)
# 使用 Beautiful Soup 库解析 HTML 内容
soup = BeautifulSoup(response.content, 'html.parser')
# 根据表格标签和行标签获取表格中的所有行
table = soup.find('table')
rows = table.find_all('tr')
# 遍历每一行并获取单元格内容
for row in rows:
cells = row.find_all('td')
for cell in cells:
print(cell.text.strip()) # 打印单元格内容,去除空白符
相关内容