Title
Content paragraph
- Item 1
- Item 2
可能是由于网页源代码中的值与我们期望查找的值的格式不同,或者是我们的查找方法不正确。可以先查看网页源代码,确定要查找的值是否存在,如果存在,则尝试使用其他方法进行查找。例如,可以使用select方法进行查找,或者使用正则表达式进行匹配。下面是一个使用正则表达式进行匹配的示例代码:
import re
from bs4 import BeautifulSoup
html = """
Title
Content paragraph
- Item 1
- Item 2
"""
soup = BeautifulSoup(html, "html.parser")
pattern = re.compile("Item[\s]+1") # 正则表达式,匹配字符串 Item 1
items = soup.find_all(text=pattern) # 查找文本内容
print(items)
运行结果为:
['Item 1']
这意味着我们成功地找到了文本内容为“Item 1”的标签。