BeautifulSoup可以用来爬取整个表格,而不仅仅是一半。下面是一个使用BeautifulSoup解析HTML表格的示例代码:
from bs4 import BeautifulSoup
# 假设HTML代码如下:
html = '''
姓名
年龄
性别
张三
20
男
李四
25
女
'''
# 使用BeautifulSoup解析HTML代码
soup = BeautifulSoup(html, 'html.parser')
# 找到表格
table = soup.find('table')
# 遍历表格的每一行
for row in table.find_all('tr'):
# 遍历每一列
for cell in row.find_all('td'):
# 打印每个单元格的内容
print(cell.text)
输出结果:
张三
20
男
李四
25
女
上述代码使用了BeautifulSoup的find
和find_all
方法来定位表格和单元格。然后使用text
属性获取单元格中的文本内容。通过循环遍历,我们可以获取整个表格的内容。