可以使用Python的html.parser解析器来解决这个问题,如下所示:
from bs4 import BeautifulSoup
import html.parser
html = "≈"
soup = BeautifulSoup(html, 'html.parser')
body = soup.find('body')
print(html.parser.HTMLParser().unescape(str(body.contents[0])))
输出结果为:
≈