美丽的汤
Beautiful Soup 是一个用于解析HTML和XML文档的Python库。
以下是使用Beautiful Soup库从标签定义中获取值的代码示例:
from bs4 import BeautifulSoup
html = '''
Beautiful Soup - 从标签定义中获取值
美丽的汤
Beautiful Soup 是一个用于解析HTML和XML文档的Python库。
'''
soup = BeautifulSoup(html, 'html.parser')
# 通过标签名获取元素的值
title = soup.title.string
print("网页标题:", title)
# 通过class属性获取元素的值
div = soup.find('div', class_='content')
h1 = div.h1.string
print("网页主标题:", h1)
# 通过标签路径获取元素的值
p = soup.body.div.p.string
print("网页段落内容:", p)
输出:
网页标题: Beautiful Soup - 从标签定义中获取值
网页主标题: 美丽的汤
网页段落内容: Beautiful Soup 是一个用于解析HTML和XML文档的Python库。
在上述代码中,首先导入了Beautiful Soup库。然后,定义了一个HTML字符串,并使用Beautiful Soup库将其解析为BeautifulSoup对象。接下来,通过不同的方式获取了标签元素的值。通过标签名获取元素的值使用了.title.string
,通过class属性获取元素的值使用了.find('div', class_='content')
,通过标签路径获取元素的值使用了.body.div.p.string
。最后,将获取的值打印出来。