以下是使用BeautifulSoup库抓取位于
标签的代码示例:
from bs4 import BeautifulSoup
# 假设网页内容保存在html变量中
html = '''
标题1
段落1
标题2
段落2
标题3
段落3
'''
# 创建BeautifulSoup对象
soup = BeautifulSoup(html, 'html.parser')
# 使用find_all方法查找所有的标签
h3_tags = soup.find_all('h3')
# 遍历每个标签
for h3_tag in h3_tags:
# 获取标签之后的第一个
标签
p_tag = h3_tag.find_next_sibling('p')
# 打印
标签的文本内容
print(p_tag.get_text())
输出结果:
段落1
段落2
段落3
以上代码首先创建了一个BeautifulSoup对象,然后使用find_all方法查找所有的
标签,并通过get_text方法获取其文本内容。