BeautifulSoup是一个Python库,可以用于从HTML或XML文档中提取数据。它并不限制只能抓取表格的第一项,可以抓取表格中的任意数据。
以下是一个使用BeautifulSoup抓取表格数据的示例代码:
from bs4 import BeautifulSoup
# 假设HTML代码如下
html = '''
姓名
年龄
性别
张三
20
男
李四
25
女
'''
# 创建BeautifulSoup对象
soup = BeautifulSoup(html, 'html.parser')
# 找到表格
table = soup.find('table')
# 遍历表格的所有行
for row in table.find_all('tr'):
# 遍历行中的所有单元格
for cell in row.find_all('td'):
# 输出单元格的内容
print(cell.text)
这段代码会输出表格中每个单元格的内容:
张三
20
男
李四
25
女
通过遍历表格的所有行和单元格,我们可以获取表格中的所有数据,而不仅仅是第一项。