本文主要是介绍Python 爬虫中 wad库的‘gbk‘编码问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Python 爬虫中 wad库的'gbk'编码问题
最近开始学习python的爬虫。
在吕云翔等编写的Python网络爬虫-从入门到精通一书之中,在介绍查看网站所用的技术时,提到了使用wad库的方法。
但我在使用的过程中遇到了如下的问题:
这里先直接给出解决的方法。
打开到clues.py, 找到第46行,在open函数中增加encoding=‘utf-8’这项参数。之后保存了就可以正常的运行程序了。
下面是我个人的寻找经历…
首先是去网上直接查、但是关于wad库基本就没有任何的信息。通过提示信息我大概知道是gbk编码的问题,于是又在这方面找了很久,有看到open函数中关于编码参数的讲解,可是因为封装的原因,不知道怎么就着提供的detect等函数来修改相关的编码参数。也尝试过修改系统的默认编码,可是最终发现系统的默认编码就是‘utf-8’.最终只能暴力的去修改库了…
总而言之就是json在打开文件时候的编码问题,因为wad库的相关内容很少,所以我决定还是写一篇博客,看看能不能帮到遇到相同问题的人。
这篇关于Python 爬虫中 wad库的‘gbk‘编码问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!