下面是一个示例代码,展示了如何使用BeautifulSoup库从最后一个HTML源代码中返回h1标签。
from bs4 import BeautifulSoup
# 假设html是一个包含多个HTML源代码的字符串
html = '''
Page Title
First Heading
This is a paragraph.
Page Title
Second Heading
This is another paragraph.
'''
# 使用BeautifulSoup解析HTML代码
soup = BeautifulSoup(html, 'html.parser')
# 找到所有的h1标签
h1_tags = soup.find_all('h1')
# 取最后一个h1标签
last_h1_tag = h1_tags[-1]
# 输出最后一个h1标签的文本内容
print(last_h1_tag.text)
在上面的示例中,我们首先将包含多个HTML源代码的字符串传递给BeautifulSoup的构造函数,以创建一个BeautifulSoup对象。然后,我们使用find_all
方法找到所有的h1标签,并使用[-1]
索引获取最后一个h1标签。最后,我们打印最后一个h1标签的文本内容。