本文主要是介绍第10课:利用Headers 的 cookie,实现爬取需要登录的网站信息,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
本节课目录:
- Cookie 的概念:
- 网站 Cookie 的获取方法 :
- Cookie 访问登录网站演示:
- 实战演习:
- Cookie 安全:
- 本节课总结:
Cookie 的概念:
Cookie 是储存在用户本地终端上的数据。是由用户使用浏览器请求访问服务器端时,服务端接受到请求后会自动生成一个Cookie数据。并把Cookie 返回给浏览器,允许浏览器访问服务器网站。浏览器收到Cookie后,会把Cookie保存下来。当发送下一个请求的时候,会直接调用保存下来的Cookie 请求访问服务端。
通俗意思:
我要访问某国,首先我要申请一个我能允许通行证申请,当某国收到这个申请后,就开始制作一个通行证,然后发给我,我收到通行证之后,我就可以访问某国了。当要进入某国的时候,我需要把通行证给某国的关卡看。关卡看了后是允许访问的,然后让我进了。
其中的申请,就是发送一个请求。制作通行证就是 服务器生成了一个Cookie ,然后将 Cookie(通行证)发给我,我再一次访问服务器网站,就需要使用这个通行证,也就是这个 Cookie 。
网站 Cookie 的获取方法 :
打开CSDN 网站 https://blog.csdn.net/nav/python ,鼠标右键 查看元素 或者 检查,或者 按键盘的 F12 的快捷键,打开 开发者调试模式,点击Doc,点击 HTML 文档,点击Headers ,找到 Requests Headers ,在 Requests Headers 有一个Cookie 的一些数据。
动态图操作演示如下&
这篇关于第10课:利用Headers 的 cookie,实现爬取需要登录的网站信息的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!