bca0a4127a4128a4141专题

spider小案例~https://industry.cfi.cn/BCA0A4127A4128A4141.html

一、获取列表页信息通过抓包发现列表页信息非正常返回，列表信息如下图：通过观察发现列表页信息是通过unes函数进行处理的，我们接下来去看下该函数该函数是对列表页的信息先全局替换"~"为"%u"，然后再通过unescape函数对替换后的字符串进行解码，到此我们就可以获取到列表页的信息了，我们用Python来还原一下 import refrom urllib.parse