标题
段落1
段落2
链接你可以使用Python的BeautifulSoup库来解析HTML页面,并遍历其中的内容控件和它们的标签。以下是一个示例代码:
from bs4 import BeautifulSoup
# 假设HTML页面保存在一个名为html的字符串中
html = """
示例页面
"""
# 创建BeautifulSoup对象
soup = BeautifulSoup(html, 'html.parser')
# 遍历所有内容控件和它们的标签
for tag in soup.find_all():
# 输出内容控件的标签名和内容(如果有)
print(tag.name, tag.string)
运行以上代码,你将会得到以下输出:
html None
head None
title 示例页面
body None
div None
h1 标题
p 段落1
p 段落2
a 链接
这个示例代码使用BeautifulSoup的find_all()
方法来找到页面中的所有标签,并使用tag.name
和tag.string
分别获取标签名和内容。你可以根据需要进一步处理这些标签和内容,例如提取链接、保存文本等。
上一篇:遍历内联定义的数组
下一篇:遍历N个嵌套的列表和字典