使用BeautifulSoup作为XML解析器时,可以通过指定解析器类型为"lxml-xml"或"xml"来解决生成不想要的html/body问题。
以下是代码示例:
from bs4 import BeautifulSoup
xml_data = """
Hello, World!
"""
soup = BeautifulSoup(xml_data, "lxml-xml")
# 或者使用以下方式
# soup = BeautifulSoup(xml_data, "xml")
# 获取根节点
root = soup.find("root")
print(root)
# 获取html节点
html = soup.find("html")
print(html)
# 获取body节点
body = soup.find("body")
print(body)
输出结果将会是:
Hello, World!
通过指定解析器类型为"lxml-xml"或"xml",BeautifulSoup将会按照XML的标准解析数据,从而避免生成不想要的html/body。