zl程序教程

您现在的位置是:首页 >  其它

当前栏目

UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\U0001f914’ in posit[通俗易懂]

通俗易懂 in can character GBK Encode codec Posit
2023-06-13 09:13:03 时间

大家好,又见面了,我是你们的朋友全栈君。

原码

#保存爬取结果(微博评论)
result.to_csv('egg_comment.csv',encoding='gbk')

报错

UnicodeEncodeError: 'gbk' codec can't encode character '\U0001f914' in posit

原因 网上很多内容都是采用utf8编码的,gbk无法编码字符’\U0001f914’,所以’utf8’格式的数据被转成’gbk’,会因为无法编码unicode的某些字符而出错。 解决

result.to_csv('egg_comment.csv',encoding='gb18030')

更多常见编码

编码

语言

utf8

所有语言

gbk

简体中文

gb2312

简体中文

gb18030

简体中文

big5

繁体中文

big5hkscs

繁体中文

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/234089.html原文链接:https://javaforall.cn