使用Python的内置open()函数打开文件,并将文件内容作为参数传递给BeautifulSoup对象。参考代码如下:
import codecs
from bs4 import BeautifulSoup
with codecs.open('example.html', 'r', 'utf-8') as file:
soup = BeautifulSoup(file.read(), 'html.parser')
使用codecs.open()函数可以确保以正确的字符集打开文件,避免了字符编码问题。这样,文件内容就可以被正确地传递给BeautifulSoup对象并解析了。