使用Beautiful Soup的prettify()方法,将HTML文档格式化为标准的缩进格式,即可自动补齐一些缺失的标签。示例代码如下:
from bs4 import BeautifulSoup
# 假设原始的HTML文档为html_doc字符串
soup = BeautifulSoup(html_doc, 'html.parser')
# 使用prettify()方法格式化文档,并重新赋值给html_doc
html_doc = soup.prettify()
# 现在的html_doc就是已经补齐了一些缺失标签的HTML文档了
需要注意的是,prettify()方法只能补齐一些简单的缺失标签,对于复杂的缺失标签,还需要手动添加。同时,如果文档中存在大量的缺失标签,使用prettify()方法可能会使代码性能下降。因此,在使用prettify()方法之前,应该先检查文档中缺失标签的情况,尽量手动添加缺失的标签。