BeautifulSoup的.text方法用于获取标签内的文本内容。但是,如果调用.text方法的对象是ResultSet对象(结果集对象),就会出现错误,因为ResultSet对象本身没有属性'text'。
解决该问题的方法是使用循环遍历结果集中的每个标签,并分别调用每个标签对象的.text方法来获取其文本内容。
下面是一个代码示例:
from bs4 import BeautifulSoup
html = """
标题1
标题2
段落1
段落2
"""
soup = BeautifulSoup(html, 'html.parser')
tags = soup.find_all('p') # 查找所有的标签
for tag in tags:
text = tag.text # 获取每个标签的文本内容
print(text)
输出结果:
段落1
段落2
在上面的示例中,我们首先使用find_all方法查找所有的
标签,并将结果保存在一个列表中。然后,使用循环遍历列表中的每个标签,分别调用每个标签对象的.text方法来获取其文本内容。