确保文件是正确的Base64编码,可以使用在线Base64编解码器进行检查。
确认文件是否是GZIP压缩的,可以使用Python gzip库中的GzipFile解压缩。
解压缩后得到的数据可能不是HTML文件,可以使用Python中的BeautifulSoup等HTML解析库对数据进行解析。
代码示例:
import base64
import gzip
from bs4 import BeautifulSoup
# Base64编码的数据
data = "H4sIAAAAAAAAA/NIzcnJVyjPL8pJUQQAp2QFDwAAAA=="
# 解码Base64
decoded_data = base64.b64decode(data)
# 解压缩GZIP
unzipped_data = gzip.GzipFile(fileobj=decoded_data).read()
# 解析HTML
parsed_html = BeautifulSoup(unzipped_data, 'html.parser')
# 打印HTML内容
print(parsed_html.prettify())