集思录专题

6.6 集思录——可转债信息爬取(使用XPath获取所需网页源代码,解决selenium模拟登录但是未能获取目标网页源代码、MultiIndex问题)

本节要从债券相关网站集思录上爬取可转债信息。在浏览器中打开网址https://www.jisilu.cn/data/cbnew/#cb,可看到可转债的各种信息,如下图所示。 首先用Selenium库访问网址并获取网页源代码,代码如下: from selenium import webdriverbrowser = webdriver.Chrome()url = 'https://www.ji