实际上,BeautifulSoup4文档确实没有明确说明class_参数的用法。但是,根据实际测试和经验,我们可以这样使用class_参数:
from bs4 import BeautifulSoup
html = '
这是一段简介
这是正文内容
soup = BeautifulSoup(html, 'html.parser')
intros = soup.find_all('p', class_='intro') for intro in intros: print(intro.text)
contents = soup.find_all('p', class_='content') for content in contents: print(content.text)
这里值得注意的是,在使用class_参数时,需要在参数名后面加上一个下划线。这是因为class是Python关键字,而在BeautifulSoup4中,为了避免使用关键字,将其改名为class_。所以在使用class_时,必须要加上下划线。