该问题通常由于使用不正确的XPATH表达式导致(例如,缺少斜杠或选择器不正确)。解决方法是检查XPATH表达式并确保其正确。以下是一个示例:
from lxml import html
# Sample HTML
html_string = ' My Title Hello world!
'
# Parse the HTML
tree = html.fromstring(html_string)
# Find all the tags in the HTML
tags = tree.xpath('//*')
# Loop through the tags and print the tag name
for tag in tags:
print(tag.tag)
在上面的示例中,我们使用了'//*'
作为XPATH表达式来查找HTML中的所有标签。然后,我们使用循环遍历这些标签,并使用tag.tag
属性打印标签名称。这将正确遍历HTML中的所有标签。
上一篇:遍历表名并更新查询
下一篇:遍历标签文件似乎会添加一个问号。