Beautiful Soup默认会使用系统默认编码进行解析,但是可以通过以下方式指定编码:
soup = BeautifulSoup(html_doc, 'html.parser', from_encoding='utf-8')
soup = BeautifulSoup(html_doc.decode('utf-8'), 'html.parser')
注意:无论哪种方式,都需要保持和实际编码一致。如果指定的编码和实际编码不相符,则会出现乱码。 免责声明:本文内容通过AI工具匹配关键字智能整合而成,仅供参考,火山引擎不对内容的真实、准确或完整作任何形式的承诺。如有任何问题或意见,您可以通过联系service@volcengine.com进行反馈,火山引擎收到您的反馈后将及时答复和处理。