使用Beautiful Soup库可以通过属性名称来查找所有标签,无论标签名称是什么。以下是一个示例代码:
from bs4 import BeautifulSoup
# 示例HTML代码
html = '''
Beautiful Soup Demo
标题1
标题2
这是一个段落。
这是另一个段落。
这是一个包含在容器中的段落。
这是一个包含在容器中的span标签。
'''
# 创建Beautiful Soup对象
soup = BeautifulSoup(html, 'html.parser')
# 找出所有具有class属性的标签
tags_with_class = soup.find_all(class_=True)
# 输出所有具有class属性的标签的值
for tag in tags_with_class:
print(tag.get_text())
运行上述代码会输出所有具有class属性的标签的文本值(即标签内的内容):
这是一个段落。
这是另一个段落。
这是一个包含在容器中的段落。
这是一个包含在容器中的span标签。
通过在find_all()
函数中设置class_=True
参数,可以找到所有具有class属性的标签。然后可以使用get_text()
方法获取标签的文本值。