转载

发表于 2015年06月07日
浏览 (846)
评论 (0)

Python文件读取编码错误问题解决之（PyCharm开发工具默认设置的坑。。。）

刚接触Python学习，正准备做个爬虫的例子，谁知道代码一开始就遇到了一个大坑，狂汗啊。

问题是这样的：我通过代码爬取了博客园首页的HTML代码并存入到blog.txt文件当中，然后准备读取出来之后进行分析，可就在读取文件的这一步出现了问题。

执行读取代码的时候程序总是会抛一个叫 “ UnicodeEncodeError: 'gbk' codec can't encode character '/xbb' in position 117274: illegal multibyte sequence ”的异常。

刚开始以为是简单的编码问题，又是在代码中设置编码格式，又是百度谷歌的。可是，没找到一个靠谱的解决方案，问题依然存在。

折腾了好几天实在是没办法了，后来突然想到会不会和IDE的设置有关系（我使用的IDE是PyCharm）。呵呵，折腾一番还真的解决了。

错误截图：

Python文件读取编码错误问题解决之（PyCharm开发工具默认设置的坑。。。）

步骤一：打开IDE的设置选项

Python文件读取编码错误问题解决之（PyCharm开发工具默认设置的坑。。。）

步骤二查看编码设置，并将所有设置都设置为UTF-8

Python文件读取编码错误问题解决之（PyCharm开发工具默认设置的坑。。。）

步骤三编码设置完后重新执行代码，问题解决

Python文件读取编码错误问题解决之（PyCharm开发工具默认设置的坑。。。）

正文到此结束

所属分类：编程技术

本文标签： 百度开发谷歌 HTML 代码 IDE UI
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

openfire数据库安装指南

浏览(14,791) 评论(0)
Caffe 深度学习框架上手教程

浏览(11,126) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(11,938) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(11,838) 评论(0)
Decorators in ES7

浏览(16,457) 评论(4)
用Electron（Atom编辑器的兄弟项目）开发桌面应用

浏览(29,430) 评论(0)
Windows下JetBrains CLion中文输出乱码的解决方法

浏览(12,881) 评论(1)
同步-@synchronized, NSLock, pthread, OSSpinLock性能比较

浏览(11,801) 评论(0)
【开班了】JAVA培训班正式招生

浏览(7,928) 评论(12)
Seaweedfs之Volume读请求重定向

浏览(26,097) 评论(3)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG