本文主要是介绍【python 爬虫】python中url链接编码处理方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
一、问题描述
有些网址,会把中文编码成gb2312格式,例如百度知道,美容这一词,网址上面会编码成:
%C3%C0%C8%DD
那么如何生成这种编码呢?
二、解决方法
1、把要编码的文字encode成所需格式
2、利用urllib 库的quote方法编码
# -*- coding:utf-8*-
import sys
reload(sys)
sys.setdefaultencoding('utf-8')key=str("美容").decode('utf-8').encode('gb2312')
import urllib
m1=urllib.quote(key)
print m1
D:\Python27\python.exe F:/PycharmProjects/url编码.py
%C3%C0%C8%DDProcess finished with exit code 0
这篇关于【python 爬虫】python中url链接编码处理方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!