urliib专题

在网页中输入中文进行搜索,如何获取搜索后页面的URL(python urliib中quote的使用)

今天在爬虫工作中发现前几天使用selenium库自动化爬取的时候有一个错误的问题。 这个地方我想要或得到搜索后网站的url网址。用了一个笨办法。通过分段获取到代表该字的字符编码。 这个有一点多此一举了。 之所以我们在网页地址栏看到的汉字变成url以后是其他的编码是因为http协议中,URL只支持部分的ASCⅡ码。对于中文等特殊字符需要进行编码才可。 python中的urllib.parse包对