Beautiful Soup 4在将HTML文档转换为"html"或"lxml"时不会删除"
"之后的所有内容。它会尽可能地保留文档的完整性。
以下是一个示例代码,演示如何使用Beautiful Soup 4将HTML文档转换为"html"或"lxml",并保留""之后的所有内容:
from bs4 import BeautifulSoup html = """ Example Page Hello, World! This is an example page.
This is an example page.