使用encode()方法时,指定errors参数为"ignore",可以忽略不支持的UTF-8序列长度并继续编码。示例代码如下:
string = "你好�"
encoded_string = string.encode(encoding='utf-8', errors='ignore')
print(encoded_string)
输出结果:
b'\xe4\xbd\xa0\xe5\xa5\xbd\xf0\x9f\x91\x8b'
其中,b表示返回的是bytes类型的编码结果,\xe4\xbd\xa0\xe5\xa5\xbd是"你好"的UTF-8编码结果,\xf0\x9f\x91\x8b是"�"的UTF-8编码结果。忽略了不支持的UTF-8序列长度,输出了正确的编码结果。
上一篇:编码字符串解码