要返回整个DIV的内容,但不包含其中的值,你可以使用BeautifulSoup库中的Tag.decompose()
方法来移除标签中的所有内容。下面是一个示例代码:
from bs4 import BeautifulSoup
# 假设你有一个HTML文档的字符串
html_doc = """
网页标题
这是一个标题
这是一个段落。
- 列表项1
- 列表项2
- 列表项3
"""
# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(html_doc, 'html.parser')
# 找到目标DIV标签
div_tag = soup.find('div', class_='container')
# 移除DIV标签中的所有内容
div_tag.decompose()
# 打印剩下的HTML内容
print(soup)
在上面的示例中,我们首先使用find()
方法找到具有class="container"
属性的DIV标签。然后,我们使用decompose()
方法移除了DIV标签中的所有内容。最后,我们打印了剩下的HTML内容,即不包含DIV标签的内容。