要提取HTML中的项目符号,但排除导航栏,可以使用BeautifulSoup库和CSS选择器来实现。
以下是一个示例代码:
from bs4 import BeautifulSoup
html = """
- 项目1
- 项目2
- 项目3
"""
soup = BeautifulSoup(html, 'html.parser')
# 使用CSS选择器选择包含项目符号的标签,但不包括导航栏
items = soup.select('ul.content li')
# 遍历每个项目并打印内容
for item in items:
print(item.text)
输出结果将是:
项目1
项目2
项目3
在这个示例中,我们使用CSS选择器选择了ul.content li
,其中ul.content
选择了包含项目符号的
标签,而li
选择了其中的每个项目。这样就实现了提取项目符号,但排除导航栏的功能。