解决这个问题的方法是使用另一个Python库,例如lxml,来解析HTML。
以下是使用lxml解决这个问题的代码示例:
from lxml import etree
html = """
Example
Cell 1
Cell 2
"""
# 使用lxml解析HTML
parser = etree.HTMLParser()
tree = etree.fromstring(html, parser)
# 通过XPath选取td标签
td_tags = tree.xpath("//td")
# 输出td标签的内容
for td in td_tags:
print(td.text)
运行以上代码,你将会得到以下输出:
Cell 1
Cell 2
这种方法可以解决Beautiful Soup无法检测到td标签结束的问题,因为lxml库使用的是更强大和严格的解析器。