BeautifulSoup4
BeautifulSoup4是一个强大的HTML解析库。
- 简单易用
- 功能强大
- 广泛应用
要使用BeautifulSoup4查找方法,首先需要安装BeautifulSoup库。可以使用pip命令进行安装:
pip install beautifulsoup4
安装完成后,可以按照以下步骤使用BeautifulSoup4查找方法来解析HTML代码:
from bs4 import BeautifulSoup
html = '''
Example Page
BeautifulSoup4
BeautifulSoup4是一个强大的HTML解析库。
- 简单易用
- 功能强大
- 广泛应用
'''
soup = BeautifulSoup(html, 'html.parser')
title = soup.find('title') # 查找第一个title标签
print(title.text) # 输出:Example Page
h1 = soup.find('h1') # 查找第一个h1标签
print(h1.text) # 输出:BeautifulSoup4
div = soup.select_one('div#content') # 通过id查找div元素
print(div.text)
lis = soup.select('ul li') # 查找所有ul下的li元素
for li in lis:
print(li.text)
div = soup.find('div', id='content') # 通过id属性查找div元素
print(div.text)
lis = soup.find_all('li', class_='item') # 通过class属性查找所有li元素
for li in lis:
print(li.text)
使用以上方法,可以根据需要查找并提取HTML代码中的特定元素和内容。
上一篇:BeautifulSoup4不能将≈解析为HTML实体
下一篇:BeautifulSoup4错误,"AttributeError: 'NoneType'对象没有属性'find'"。