Python11 使用爬虫实现图书250排行榜信息爬取

2024-06-20 12:44

本文主要是介绍Python11 使用爬虫实现图书250排行榜信息爬取,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

图片

1.什么是网络爬虫

Python爬虫是使用Python编程语言编写的程序,它能自动从互联网上抓取数据。这类程序一般利用网络请求来访问网站,解析网站的HTML或其他格式的内容,提取出有用的数据,有时还会进行后续的数据处理或存储。

Python爬虫的用途包括:

  1. 数据收集:对于数据分析师和研究人员来说,爬虫可以帮助从各种网站上自动化收集数据,如社交媒体数据、金融市场数据、商品信息等。

  2. 监控网站:爬虫可以用来监控网站的变化,比如价格变动、新闻更新、股票市场动态等,对于商业智能和市场分析尤其有用。

  3. 搜索引擎:搜索引擎如Google和Bing使用爬虫技术来索引互联网上的网页,以便用户可以通过搜索引擎找到这些网页。

  4. 自动化测试:开发者可以使用爬虫来监测网站功能是否正常,比如检查链接是否有效,确保页面内容显示正确等。

  5. 内容聚合:爬虫可用于从多个源收集信息,并将其集成在一起,提供内容聚合服务。例如新闻聚合、博客聚合等。

Python在爬虫领域的流行原因:

  • 强大的库支持:Python拥有强大的库来支持爬虫的制作,如requests用于网络请求,BeautifulSouplxml用于HTML解析,ScrapySelenium用于更复杂的爬虫项目。

  • 简单易学:Python语法简单,易于学习和编写,使得编写爬虫变得更加容易。

  • 广泛的社区支持:由于Python在数据科学和网络爬虫领域的广泛应用,可以很容易地找到问题的解决方案和优化的建议。

尽管Python爬虫有很多合法的应用,但是在使用爬虫时也必须遵守相关法律法规和网站的robots.txt文件,尊重网站的版权和服务条款,合法合规地使用网络爬虫技术。

2.使用爬虫爬取图书250数据

①一般方式(针对未设置反爬虫程序的网站)

由于目标网站存在反爬虫程序,因此运行下面这段代码会显示错误。

代码示例:

import requests  # 发起网络请求
from lxml import etree  # 解析HTML文档res=requests.get('https://book.douban.com/top250?start=0')
html=etree.HTML(res.text)
book_names=html.xpath('//div[@class="pl2"]/a/@title')
book_authors=html.xpath('//p[@class="pl"]/text()')
book_ratios=html.xpath('//span[@class="rating_nums"]/text()')
book_quotes=html.xpath('//span[@class="inq"]/text()')
# print(book_authors)
# print(book_ratios)
# print(len(book_ratios))
# print(book_quotes)
for i in zip(book_names,book_quotes,book_ratios):a,b,c=i
#     print(a,b,c)
authors=[]
for i in book_authors:#print(i.split('/')[0])authors.append(i.split('/')[0])
# print(authors)for i in zip(book_names,authors,book_quotes,book_ratios):a,b,c,d=i
#     print(i)print(a,b,c,d)

由于存在反爬虫程序,因此上面的程序无法获取到网页上的数据。html 对象是 None,这通常是因为 etree.HTML(res.text) 无法解析 res.text 中的内容作为HTML,或者请求得到的内容为空导致。

运行结果:

图片

②对于存在反爬虫的网站

需要添加一些代码防止被网站判定为爬虫程序,但最终的输出数据只有24条,并没有250条

import requests  # 发起网络请求
from lxml import etree  # 解析HTML文档
import time  # 用于控制时间(如等待),以避免请求过于频繁# 创建会话以维持cookie
session = requests.Session()  # 创建一个会话对象,这可以使得在多次请求中保持某些参数,如Cookies
#  设置User-Agent为一个常见浏览器的标识,这有助于防止被网站以为是爬虫而拒绝服务
session.headers.update({'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
})
# 使用会话对象请求网页,设置超时为10秒
url = 'https://book.douban.com/top250?start=0'
try:res = session.get(url, timeout=10)res.raise_for_status()  # 如果响应状态码不是 200,将抛出 HTTPError 异常html = etree.HTML(res.text)  # 使用lxml的HTML函数解析获取到的网页源码if html is not None:# book_names:提取书名# book_authors:提取包含作者和出版信息的文本# book_ratios:提取书籍评分# book_quotes:提取书籍的引语book_names=html.xpath('//div[@class="pl2"]/a/@title')book_authors=html.xpath('//p[@class="pl"]/text()')book_ratios=html.xpath('//span[@class="rating_nums"]/text()')book_quotes=html.xpath('//span[@class="inq"]/text()')# print(book_authors)# print(book_ratios)# print(len(book_ratios))# print(book_quotes)for i in zip(book_names,book_quotes,book_ratios):  # 使用zip函数将提取的书名、引语和评分组合在一起,并在循环中处理每一项a,b,c=i#     print(a,b,c)authors=[]for i in book_authors:#print(i.split('/')[0])authors.append(i.split('/')[0])# print(authors)for i in zip(book_names,authors,book_quotes,book_ratios):a,b,c,d=i#     print(i)print(a,b,c,d)  # 打印提取到的数据else:print("Failed to parse HTML: etree.HTML() returned None")# 捕获并处理HTTPError、ConnectionError、Timeout以及其他请求异常
except requests.exceptions.HTTPError as e:print(f"HTTP Error: {e}")
except requests.exceptions.ConnectionError as e:print(f"Connection Error: {e}")
except requests.exceptions.Timeout as e:print(f"Timeout Error: {e}")
except requests.exceptions.RequestException as e:print(f"Error: {e}")# 在请求结束后暂停2秒,减少对豆瓣服务器的压力,也降低被封禁的风险
time.sleep(2)

运行结果:

图片

③完善一下代码,得到177条数据

由于有的图书没有引语,所以zip()函数不会把该图书放入图书列表中。

图片

import requests
from lxml import etree
import timedef fetch_page(url):""" 获取单个页面的内容并解析数据 """try:response = session.get(url, timeout=10)response.raise_for_status()  # 检查请求是否成功html = etree.HTML(response.text)if html is not None:book_names = html.xpath('//div[@class="pl2"]/a/@title')book_authors = html.xpath('//p[@class="pl"]/text()')book_ratios = html.xpath('//span[@class="rating_nums"]/text()')book_quotes = html.xpath('//span[@class="inq"]/text()')authors = [info.split('/')[0].strip() for info in book_authors]return list(zip(book_names, authors, book_quotes, book_ratios))else:print("Failed to parse HTML.")return Noneexcept requests.exceptions.RequestException as e:print(f"Request failed: {e}")return None# 创建会话对象
session = requests.Session()
session.headers.update({'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
})base_url = 'https://book.douban.com/top250?start='
books = []# 从0到250,每次递增25
for start in range(0, 250, 25):print(f"Fetching page starting at {start}")url = f"{base_url}{start}"page_books = fetch_page(url)if page_books:books.extend(page_books)# 等待一段时间以避免被封time.sleep(2)# 打印所有提取的信息
for book in books:print(book)

运行结果(部分):

图片

④进一步优化代码实现250条图书数据的收集

当发现有的图书没有引语(quote),这可能导致在原有代码中,使用zip()  函数时因为长度不匹配而丢失这些图书的记录。因为 zip() 函数只会组合最短的列表长度的元素,如果某本书没有引语,那么其他信息也会被丢弃。

要解决这个问题,可以在提取数据时考虑这种情况,确保即使某些书籍缺少引语也能包括这些书的其他信息。一种方法是在提取引语时填充默认值(例如空字符串)以保持列表长度一致。

示例代码:

import requests
from lxml import etree
import timedef fetch_page(url):""" 获取单个页面的内容并解析数据 """try:response = session.get(url, timeout=10)response.raise_for_status()  # 检查请求是否成功html = etree.HTML(response.text)if html is not None:book_names = html.xpath('//div[@class="pl2"]/a/@title')book_authors = html.xpath('//p[@class="pl"]/text()')book_ratios = html.xpath('//span[@class="rating_nums"]/text()')# 尝试提取引语,如果某书没有引语,则填充空字符串book_quotes = html.xpath('//span[@class="inq"]/text()')# 确保书名、作者、评分、引语列表长度相同if len(book_quotes) < len(book_names):# 为缺失的引语添加空字符串book_quotes.extend([""] * (len(book_names) - len(book_quotes)))authors = [info.split('/')[0].strip() for info in book_authors]return list(zip(book_names, authors, book_quotes, book_ratios))else:print("Failed to parse HTML.")return Noneexcept requests.exceptions.RequestException as e:print(f"Request failed: {e}")return None# 创建会话对象
session = requests.Session()
session.headers.update({'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
})base_url = 'https://book.douban.com/top250?start='
books = []# 从0到250,每次递增25
for start in range(0, 250, 25):print(f"Fetching page starting at {start}")url = f"{base_url}{start}"page_books = fetch_page(url)if page_books:books.extend(page_books)# 等待一段时间以避免被封time.sleep(2)# 打印所有提取的信息
for book in books:print(book)

运行结果:

Fetching page starting at 0
Fetching page starting at 25
Fetching page starting at 50
Fetching page starting at 75
Fetching page starting at 100
Fetching page starting at 125
Fetching page starting at 150
Fetching page starting at 175
Fetching page starting at 200
Fetching page starting at 225
('红楼梦', '[清] 曹雪芹 著', '都云作者痴,谁解其中味?', '9.6')
('活着', '余华', '生的苦难与伟大', '9.4')
('哈利·波特', 'J.K.罗琳 (J.K.Rowling)', '从9¾站台开始的旅程', '9.7')
('1984', '[英] 乔治·奥威尔', '栗树荫下,我出卖你,你出卖我', '9.4')
('三体全集', '刘慈欣', '地球往事三部曲', '9.5')
('百年孤独', '[哥伦比亚] 加西亚·马尔克斯', '魔幻现实主义文学代表作', '9.3')
('飘', '[美国] 玛格丽特·米切尔', '革命时期的爱情,随风而逝', '9.3')
('动物农场', '[英] 乔治·奥威尔', '太阳底下并无新事', '9.3')
('房思琪的初恋乐园', '林奕含', '向死而生的文学绝唱', '9.2')
('三国演义(全二册)', '[明] 罗贯中', '是非成败转头空', '9.3')
('福尔摩斯探案全集(上中下)', '[英] 阿·柯南道尔', '名侦探的代名词', '9.3')
('白夜行', '[日] 东野圭吾', '一宗离奇命案牵出跨度近20年步步惊心的故事', '9.2')
('小王子', '[法] 圣埃克苏佩里', '献给长成了大人的孩子们', '9.1')
('安徒生童话故事集', '(丹麦)安徒生', '为了争取未来的一代', '9.3')
('天龙八部', '金庸', '有情皆孽,无人不冤', '9.2')
('撒哈拉的故事', '三毛', '游荡的自由灵魂', '9.2')
('呐喊', '鲁迅', '新文学的第一声呐喊', '9.2')
('邓小平时代', '【美】傅高义 (Ezra.F.Vogel)', '个人命运背后的历史变局', '9.3')
('悉达多', '[德] 赫尔曼·黑塞', '有一种东西不能遵循从众原则,那就是——人的良心', '9.3')
('杀死一只知更鸟', '[美] 哈珀·李', '我的整个生命,只是一场为了提升社会地位的低俗斗争。', '9.2')
('失踪的孩子', '[意] 埃莱娜·费兰特', '不拘一格的历史书写', '9.2')
('明朝那些事儿(1-9)', '当年明月', '探索青年时代的激情、困惑、挣扎、背叛和失去', '9.2')
('新名字的故事', '[意] 埃莱娜·费兰特', '我以这一丛野草,在明与暗,生与死,过去与未来之际,献于友与仇,人与兽,爱者与不爱者之前作证。', '9.2')
('野草', '鲁迅', '沉默是沉默者的通行证', '9.5')
('沉默的大多数', '王小波', '', '9.1')
('中国历代政治得失', '钱穆', '一部简明的“中国政治制度史”', '9.2')
('局外人', '[法] 阿尔贝·加缪', '人生在世,永远也不该演戏作假', '9.1')
('白鹿原', '陈忠实', '一轴关于我们民族灵魂的现实主义画卷', '9.2')
('卡拉马佐夫兄弟', '[俄] 费奥多尔·陀思妥耶夫斯基', '跟着人类一同走过十万年', '9.6')
('人类简史', '[以色列] 尤瓦尔·赫拉利', '中国当代城乡生活全景', '9.1')
('平凡的世界(全三部)', '路遥', '路漫漫其修远兮,吾将上下而求索', '9.0')
('彷徨', '鲁迅', '中国乡土社会传统文化和社会结构理论研究代表作', '9.3')
('乡土中国', '费孝通', '幽默的语言和对生活深刻的观察', '9.2')
('罗杰疑案', '[英] 阿加莎·克里斯蒂', '欲练此功,必先自宫', '9.2')
('围城', '钱锺书', '这是你的罪孽与福祉', '9.0')
('笑傲江湖(全四册)', '金庸', '当声称能改造智能的科学实验选中心智障碍主角', '9.1')
('许三观卖血记', '余华', '谋杀诡计惊人,波洛的抉择耐人寻味', '9.2')
('我与地坛', '史铁生', '豆瓣电影Top1原著', '9.2')
('献给阿尔吉侬的花束', '[美] 丹尼尔·凯斯', '外国人眼中的涪陵', '9.1')
('东方快车谋杀案', '[英] 阿加莎·克里斯蒂', '一个报恩复仇的故事,以法国波旁王朝和七月王朝为背景', '9.1')
('肖申克的救赎', '[美] 斯蒂芬·金', '长亭外,古道边,芳草碧连天', '9.1')
('江城', '[美] 彼得·海斯勒', '拾取古代传说,取一点因由,随意点染', '9.1')
('基督山伯爵', '[法国] 大仲马', '义无反顾地直达爱情的核心', '9.1')
('城南旧事', '林海音 文', '从最早的洞窟绘画到当今的实验艺术', '9.1')
('故事新编', '鲁迅', '在纷扰中寻出一点闲静', '9.4')
('霍乱时期的爱情', '[哥伦比亚] 加西亚·马尔克斯', '见微知著,历史观的颠覆', '9.0')
('艺术的故事', '[英] 贡布里希 (Sir E.H.Gombrich)', '有多少人会经历顿悟,就有更少的人甘愿自我放逐', '9.5')
('朝花夕拾', '鲁迅', '', '9.1')
('万历十五年', '[美] 黄仁宇', '', '9.0')
('月亮和六便士', '[英] 毛姆', '', '9.0')
('秋园', '杨本芬', '侠之大者,为国为民', '9.0')
('射雕英雄传', '金庸', '为你,千千万万遍', '9.1')
('置身事内', '兰小欢', '《纽约客》驻北京记者驾车漫游中国大陆的经历', '9.1')
('厌女', '上野千鹤子', '一把刀的锋刃不容易越过;因此智者说得救之道是困难的', '9.1')
('追风筝的人', '[美] 卡勒德·胡赛尼', '是不是真的只有先与人疏离,才能最终与他们在一起?', '8.9')
('寻路中国', '[美] 彼得·海斯勒', '童谣杀人案', '9.0')
('刀锋', '[英]毛姆', '一本有教育意义的书', '9.0')
('树上的男爵', '[意大利]伊塔洛·卡尔维诺', '神魔皆有人情,精魅亦通世故', '9.1')
('中国少年儿童百科全书(全四册)', '林崇德 主编', '用别样的监禁生活再现某种监禁生活,与用不存在的事表现真事同等合理', '9.4')
('无人生还', '[英] 阿加莎・克里斯蒂', '数学好是一种极致的浪漫', '9.0')
('格林童话全集', '[德国]格林兄弟', '我想爱,想吃,还想在一瞬间变成天上半明半暗的云', '9.0')
('西游记(全二册)', '吴承恩', '史家之绝唱,无韵之离骚', '9.1')
('鼠疫', '[法] 阿尔贝·加缪', '所有现代言情小说的母体', '9.1')
('嫌疑人X的献身', '[日] 东野圭吾', '白先勇短篇小说集', '8.9')
('可能性的艺术', '刘瑜', '现实主义与浪漫主义的至高杰作', '9.2')
('黄金时代', '王小波', '思无邪', '8.9')
('史记(全十册)', '司马迁', '写给那一群, 在最深最深的黑夜里, 独自彷徨街头, 无所依归的孩子们', '9.6')
('始于极限', '[日] 上野千鹤子', '', '9.0')
('傲慢与偏见', '[英] 奥斯丁', '', '8.9')
('台北人', '白先勇', '', '9.0')
('悲惨世界(上中下)', '[法] 雨果', '', '9.1')
('诗经', '孔丘 编订', '', '9.5')
('孽子', '白先勇', '', '9.2')
('刘擎西方现代思想讲义', '刘擎', '', '9.2')
('太白金星有点烦', '马伯庸', '', '9.0')
('永恒的终结', '[美] 艾萨克·阿西莫夫', '关于时间旅行的终极奥秘和恢宏构想', '9.1')
('神雕侠侣', '金庸', '至情至性,情大于武', '8.9')
('历史深处的忧虑', '林达', '窥见美国社会的一扇窗', '9.0')
('上帝掷骰子吗', '曹天元', '量子物理史话', '9.2')
('美丽新世界', '【英】奥尔德斯·赫胥黎', '这个发生在瑞典的故事,如生命庆典般绚丽斑斓', '9.2')
('一个叫欧维的男人决定去死', '[瑞典] 弗雷德里克·巴克曼', '熟读唐诗三百首,不会吟诗也会吟', '9.1')
('唐诗三百首', '蘅塘退士', '北平沦陷时代广大平民的悲惨遭遇', '9.4')
('四世同堂', '老舍', '中国美学经典之作', '9.4')
('美的历程', '李泽厚', '沙漠中寻常的生与死', '9.2')
('哭泣的骆驼', '三毛', '唯有希望与爱可以驱散阴霾', '9.0')
('灿烂千阳', '[美] 卡勒德·胡赛尼', '木心留给世界的礼物', '8.9')
('文学回忆录', '木心 口述', '关于衰老与死亡,你必须知道的常识', '9.1')
('最好的告别', '[美] 阿图·葛文德(Atul Gawande)', '萧红的童年往事', '9.0')
('呼兰河传', '萧红', '真正懂孩子的教育经', '9.0')
('窗边的小豆豆', '[日] 黑柳彻子 著', '以新眼光评旧文学', '8.8')
('人间词话', '王国维', '阿勒泰的精灵', '9.0')
('冬牧场', '李娟', '描绘人内心的全部深度', '9.1')
('罪与罚', '[俄] 陀思妥耶夫斯基', '中国历史上首部完整的哲学著作', '9.3')
('道德经', '黄元吉', '在这里看见中国', '9.5')
('绝叫', '[日] 叶真中显', '了解IT领域的入门读物', '8.9')
('毛泽东选集 第一卷', '毛泽东', '', '9.6')
('棋王·树王·孩子王', '阿城', '', '9.3')
('看见', '柴静', '', '8.8')
('也许你该找个人聊聊', '[美]洛莉·戈特利布', '', '9.0')
('浪潮之巅', '吴军', '', '9.0')
('离开的,留下的', '[意] 埃莱娜·费兰特', '探索中年的虚无、困惑、野心和近乎残暴的爱', '8.9')
('叫魂', '[美] 孔飞力', '王小波与李银河的两地书', '9.2')
('爱你就像爱生命', '王小波', '失明症迅速蔓延,整个城市陷入一场空前的灾难', '8.8')
('失明症漫记', '[葡] 若泽·萨拉马戈', '在混沌纷扰的生活漩流中,寻求人生的真谛', '9.1')
('人生的枷锁', '[英] 毛姆', '家庭生活回忆录', '9.1')
('桶川跟踪狂杀人事件', '[日] 清水洁', '五个家族,一场战争', '9.0')
('我们仨', '杨绛', '江南乡镇民间生活,健康淳朴的人性', '8.8')
('看不见的城市', '[意] 伊塔洛·卡尔维诺', '“教父三部曲”电影原著', '9.0')
('巨人的陨落', '[英] 肯·福莱特', '对世俗、实用问题深刻而透彻的讨论', '8.9')
('受戒', '汪曾祺', '一个淡泊清透的世界', '9.3')
('少年凯歌', '人民文学出版社', '武侠的解构,流氓的狂欢', '9.4')
('教父', '[美]马里奥·普佐', '即使不能拥有完美的生活,所幸追求过完整的自我', '9.0')
('人生的智慧', '(德)叔本华', '清末、民初、抗战胜利以后三个历史时期的北京生活风貌', '9.2')
('海子的诗', '海子', '翻手为苍凉,覆手为繁华', '9.0')
('飞鸟集', '[印] 罗宾德拉纳德·泰戈尔', '', '8.9')
('遥远的向日葵地', '李娟', '', '9.1')
('鹿鼎记', '金庸', '', '8.9')
('斯通纳', '[美] 约翰·威廉斯', '', '8.8')
('茶馆', '老舍', '', '9.2')
('陆犯焉识', '严歌苓', '', '8.9')
('克莱因壶', '[日] 冈岛二人', '', '8.9')
('一间只属于自己的房间', '[英] 弗吉尼亚·伍尔夫', '', '9.2')
('额尔古纳河右岸', '迟子建', '', '9.1')
('西线无战事', '[德] 埃里希·玛丽亚·雷马克', '', '9.4')
('筚路维艰', '萧冬连', '', '9.5')
('人间草木', '汪曾祺', '我就是要这样香,香得痛痛快快', '9.2')
('十万个为什么', '少年儿童出版社', '一切充满了善,然而到处是不凑巧', '9.2')
('边城', '沈从文', '哀而不伤', '8.7')
('梦里花落知多少', '三毛', '伊坂幸太郎代表作', '8.8')
('金色梦乡', '[日] 伊坂幸太郎', '探索时间和空间的核心秘密', '9.0')
('时间简史', '[英] 史蒂芬·霍金', '一颗纯美纯善、永难泯灭的童心', '8.9')
('面纱', '[英] 威廉·萨默塞特·毛姆', '平淡叙述下的惊心动魄', '9.0')
('王尔德童话', '[英] 王尔德', '一个谜语,谜底正是时间', '9.1')
('13 67', '陳浩基', '一个高贵而残破的昨日镜像', '9.1')
('这些人,那些事', '吴念真', '我们好象在池塘的水底,从一个月亮走向另一个月亮', '8.8')
('小径分岔的花园', '[阿根廷] 豪·路·博尔赫斯', '我来自一个极少有人能想象的家庭,教育给了我新世界', '8.9')
('流俗地', '【马来西亚】黎紫书', '材质、结构、风格和银幕剧作的原理', '9.2')
('昨日的世界', '[奥] 斯蒂芬·茨威格', '经济学家们的世界观', '9.3')
('南京大屠杀', '[美]张纯如(Iris Chang)', '“那不勒斯四部曲”第一部,两个女人,50年的友谊和战争', '9.7')
('绿毛水怪', '王小波', '一句胜过千年', '9.1')
('你当像鸟飞往你的山', '塔拉·韦斯特弗', '白雪和阳光,青草和白桦林', '8.7')
('2001:太空漫游', '[英] 阿瑟·克拉克', '', '9.3')
('平面国', '[英] 埃德温·A.艾勃特', '', '9.2')
('故事', '[美] 罗伯特·麦基', '', '9.2')
('经济学原理(上下)', '[美] 曼昆', '', '9.1')
('我的天才女友', '[意] 埃莱娜·费兰特', '', '8.7')
('长日将尽', '[英] 石黑一雄', '', '8.9')
('海的女儿', '安徒生', '', '9.2')
('一句顶一万句', '刘震云', '', '8.8')
('阿勒泰的角落', '李娟', '', '9.1')
('鹿川有许多粪', '李沧东', '明明这么痛苦,这么难过,为什么就是不能放弃跑步?', '8.9')
('檀香刑', '莫言', '钱穆中国通史', '9.3')
('地下室手记', '(俄罗斯) 陀思妥耶夫斯基', '哲学启蒙书', '9.3')
('强风吹拂', '三浦紫苑', '暗恋的极致', '9.0')
('國史大綱(上下)', '錢穆', '从遥远的撒哈拉到敦煌戈壁', '9.4')
('全球通史(上)', '[美]斯塔夫里阿诺斯', '少年辛克莱寻找通向自身之路的艰辛历程', '9.2')
('安娜·卡列尼娜', '[俄] 列夫·托尔斯泰', '三毛在加纳利群岛的生活', '9.2')
('苏菲的世界', '[挪] 乔斯坦·贾德', '完美主义者的最高形态', '8.8')
('一个陌生女人的来信', '[奥] 斯蒂芬·茨威格', '面对强大的对手,明知不敌,也要毅然亮剑', '8.7')
('万水千山走遍', '三毛', '谦恭地、勇敢地、真诚地和有纪律地爱他人', '8.9')
('德米安', '[德] 赫尔曼·黑塞', '真实记录切尔诺贝利核灾难事件', '8.9')
('翦商', '李硕', '人间,只是抹去了脂粉的脸', '9.0')
('温柔的夜', '三毛', '量子之外,没有真相', '9.1')
('史蒂夫·乔布斯传', '[美] 沃尔特·艾萨克森', '男孩桑桑刻骨铭心、终身难忘的六年小学生活', '8.8')
('亮剑', '都梁', '乔治·R·R·马丁史诗奇幻小说', '9.0')
('爱的艺术', '[美] 艾·弗洛姆', '收录自先秦至明末的散文二百二十二篇', '8.8')
('我不知道该说什么,关于死亡还是爱情', '[白俄] S·A·阿列克谢耶维奇', '描写疆北阿勒泰地区生活和风情的原生态散文集', '9.1')
('霸王别姬', '李碧华', '', '9.1')
('半生缘', '张爱玲', '', '9.1')
('球状闪电', '刘慈欣', '', '8.7')
('不能承受的生命之轻', '米兰·昆德拉', '', '8.8')
('草房子', '曹文轩', '', '9.0')
('冰与火之歌', '[美]乔治·R.R.马丁', '', '9.5')
('古文观止', '吴楚材', '', '9.1')
('我的阿勒泰', '李娟', '', '8.9')
('恶意', '[日] 东野圭吾', '男女之间、父母与子女之间紧密的纽带和难以逾越的鸿沟', '8.7')
('倾城之恋', '张爱玲', '日常的奇迹', '8.9')
('海风中失落的血色馈赠', '[加拿大] 阿利斯泰尔·麦克劳德', '在法治国家里,民众怎样运用法律', '9.0')
('天朝的崩溃', '茅海建', '人们是如何思索、影响他人并与他人建立联系的', '9.4')
('麦琪的礼物', '[美] 欧·亨利', '这是一个最好的时代,也是一个最坏的时代', '8.7')
('我也有一个梦想', '林达', '我如此急切地想要讲述这桩案件,也许是它最终确定了我的作家生涯', '9.0')
('生死疲劳', '莫言', '活泼的生命完全无须借助魔法,便能对我们述说至美至真的故事', '9.1')
('社会心理学', '[美] 戴维·迈尔斯', '一场同名同姓的误会,两段可贵的爱情', '9.0')
('天生有罪', '[南非] 特雷弗·诺亚', '阿加莎·克里斯蒂代表作', '9.0')
('激荡三十年(上)', '吴晓波', '不识张郎是张郎', '8.8')
('亲密关系', '[美]罗兰·米勒 (Rowland S. Miller)', '人类历史上最早的乌托邦', '9.2')
('一桩事先张扬的凶杀案', '[哥伦比亚] 加西亚·马尔克斯', '人生,远比地狱更像地狱', '8.7')
('东晋门阀政治', '田余庆', '“超现实主义”风格作品,德国的《尤利西斯》', '9.5')
('李光耀观天下', '李光耀', '', '9.2')
('雕刻时光', '[苏] 安德烈·塔可夫斯基', '', '9.5')
('万物有灵且美', '[英] 吉米·哈利', '', '8.9')
('情书', '[日] 岩井俊二', '', '8.6')
('在细雨中呼喊', '余华', '', '8.8')
('尼罗河上的惨案', '[英] 阿加莎·克里斯蒂', '', '8.7')
('倚天屠龙记', '金庸', '', '8.7')
('理想国', '[古希腊] 柏拉图', '', '8.8')
('罗生门', '[日] 芥川龙之介', '', '8.7')
('从零开始的女性主义', '[日本] 上野千鹤子', '', '8.7')
('荒原狼', '[德]赫尔曼·黑塞', '', '9.0')
('父权制与资本主义', '[日] 上野千鹤子', '', '9.2')
('当呼吸化为空气', '[美] 保罗·卡拉尼什', '你在死亡中探究生命的意义,你见证生前的呼吸化作死后的空气', '8.9')
('孙子兵法', '孙武', '我国最古老最杰出的一部兵书', '9.4')
('雷雨', '曹禺', '一幕人生大悲剧,在一个雷雨夜爆发', '8.7')
('送你一颗子弹', '刘瑜', '在这本书里,被“审视”的东西杂七杂八', '8.6')
('最好的我们', '八月长安', '耿耿余淮', '8.7')
('水浒传(全二册)', '[明] 施耐庵', '替天行道', '8.7')
('浮生六记', '(清)沈复', '苟不记之笔墨,未免有辜彼苍之厚', '8.7')
('一千零一夜', '纳训', '阿拉伯地区的古代民间传说', '8.8')
('孩子你慢慢来', '龙应台', '我们现在怎样做母亲', '8.7')
('九州·缥缈录', '江南', '乱世的英雄史诗', '8.8')
('雨季不再来', '三毛', '三毛少女时代的成长感受', '8.7')
('银河帝国:基地七部曲', '[美] 艾萨克·阿西莫夫', '阿西莫夫经典科幻小说', '9.5')
('现代艺术150年', '[英] 威尔·贡培兹', '梵高悲惨而成就辉煌的人生', '9.2')
('渴望生活', '[美] 欧文·斯通', '一场穿越银河的冒险', '9.2')
('银河系漫游指南', '[英] 道格拉斯·亚当斯', '野马也,尘埃也,生物之以息相吹也', '8.8')
('庄子', '孙通海 译注', '旧中国老北京贫苦市民的典型命运', '9.4')
('骆驼祥子', '老舍', '仁远乎哉?我欲仁,斯仁至矣', '8.6')
('论语', '刘胜利', '中国人,你为什么不生气', '9.1')
('足利女童连续失踪事件', '[日] 清水洁', '特德·姜科幻小说集', '9.0')
('野火集', '龙应台', '纳粹法西斯对人心灵的折磨及摧残', '8.7')
('不存在的骑士', '[意] 伊塔洛·卡尔维诺', '', '8.9')
('你一生的故事', '[美] 特德·姜', '', '8.8')
('显微镜下的大明', '马伯庸', '', '8.7')
('帷幕', '[英]阿加莎·克里斯蒂', '', '9.1')
('象棋的故事', '[奥] 斯蒂芬·茨威格', '', '9.1')
('跨越边界的社区(修订版)', '项飙', '原作名切题', '9.4')
('命运', '蔡崇达', '用最为细小的马赛克拼出了一幅完整的后苏联时代图景', '9.0')
('你好,旧时光(上 下)', '八月长安', '20世纪中国知识分子的心灵史', '8.7')
('时间的秩序', '[意] 卡洛·罗韦利', '电影入门经典之作', '8.9')
('二手时间', '[白俄] S. A. 阿列克谢耶维奇', '火焰是我们诗歌唯一的读者', '8.9')
('大明王朝1566', '刘和平', '癌症传', '9.5')
('会饮篇', '[古希腊] 柏拉图', '在各种光怪陆离的场景中,迷失的人性引发了一连串的悲剧', '9.3')
('上学记', '何兆武 口述', '人类社会的命运', '8.9')
('认识电影', '[美] 路易斯·贾内梯', '跟火星来一场不是你死就是我活的过家家游戏', '8.9')
('坟', '鲁迅', '伴随着惩罚的人性化,自由反而日益丧失了', '9.6')
('黑箱:日本之耻', '[日] 伊藤诗织', '一个小商人家庭出身的女子曹七巧的心灵变迁历程', '8.9')
('奥斯维辛', '[英] 劳伦斯·里斯', '现代人内心流失的东西,这家杂货店能帮你找回', '9.5')
('明亮的夜晚', '[韩]崔恩荣', '美国政治法律制度的基本原理和操作细节', '9.0')
('顾城的诗', '顾城', '生存还是毁灭,这是一个值得思考的问题', '8.8')
('众病之王', '[美] 悉达多·穆克吉', '', '9.0')
('毛姆短篇小说精选集', '[英] 威廉·萨默塞特·毛姆', '', '9.1')
('枪炮、病菌与钢铁', '[美] 贾雷德·戴蒙德', '', '8.7')
('火星救援', '[美] 安迪·威尔', '', '8.9')
('规训与惩罚', '[法] 米歇尔·福柯', '', '9.3')
('分成两半的子爵', '[意] 伊塔洛·卡尔维诺', '', '8.8')
('金锁记', '张爱玲', '', '8.6')
('挽救计划', '[美] 安迪·威尔', '', '9.1')
('解忧杂货店', '[日] 东野圭吾', '', '8.5')
('总统是靠不住的', '林达', '', '8.8')
('哈姆莱特', '[英] 莎士比亚', '', '8.7')

以上内容总结自网络,如有帮助欢迎转发,我们下次再见!

这篇关于Python11 使用爬虫实现图书250排行榜信息爬取的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1078166

相关文章

Linux使用fdisk进行磁盘的相关操作

《Linux使用fdisk进行磁盘的相关操作》fdisk命令是Linux中用于管理磁盘分区的强大文本实用程序,这篇文章主要为大家详细介绍了如何使用fdisk进行磁盘的相关操作,需要的可以了解下... 目录简介基本语法示例用法列出所有分区查看指定磁盘的区分管理指定的磁盘进入交互式模式创建一个新的分区删除一个存

C#使用HttpClient进行Post请求出现超时问题的解决及优化

《C#使用HttpClient进行Post请求出现超时问题的解决及优化》最近我的控制台程序发现有时候总是出现请求超时等问题,通常好几分钟最多只有3-4个请求,在使用apipost发现并发10个5分钟也... 目录优化结论单例HttpClient连接池耗尽和并发并发异步最终优化后优化结论我直接上优化结论吧,

windos server2022里的DFS配置的实现

《windosserver2022里的DFS配置的实现》DFS是WindowsServer操作系统提供的一种功能,用于在多台服务器上集中管理共享文件夹和文件的分布式存储解决方案,本文就来介绍一下wi... 目录什么是DFS?优势:应用场景:DFS配置步骤什么是DFS?DFS指的是分布式文件系统(Distr

NFS实现多服务器文件的共享的方法步骤

《NFS实现多服务器文件的共享的方法步骤》NFS允许网络中的计算机之间共享资源,客户端可以透明地读写远端NFS服务器上的文件,本文就来介绍一下NFS实现多服务器文件的共享的方法步骤,感兴趣的可以了解一... 目录一、简介二、部署1、准备1、服务端和客户端:安装nfs-utils2、服务端:创建共享目录3、服

SpringBoot使用Apache Tika检测敏感信息

《SpringBoot使用ApacheTika检测敏感信息》ApacheTika是一个功能强大的内容分析工具,它能够从多种文件格式中提取文本、元数据以及其他结构化信息,下面我们来看看如何使用Ap... 目录Tika 主要特性1. 多格式支持2. 自动文件类型检测3. 文本和元数据提取4. 支持 OCR(光学

JAVA系统中Spring Boot应用程序的配置文件application.yml使用详解

《JAVA系统中SpringBoot应用程序的配置文件application.yml使用详解》:本文主要介绍JAVA系统中SpringBoot应用程序的配置文件application.yml的... 目录文件路径文件内容解释1. Server 配置2. Spring 配置3. Logging 配置4. Ma

Linux使用dd命令来复制和转换数据的操作方法

《Linux使用dd命令来复制和转换数据的操作方法》Linux中的dd命令是一个功能强大的数据复制和转换实用程序,它以较低级别运行,通常用于创建可启动的USB驱动器、克隆磁盘和生成随机数据等任务,本文... 目录简介功能和能力语法常用选项示例用法基础用法创建可启动www.chinasem.cn的 USB 驱动

C#使用yield关键字实现提升迭代性能与效率

《C#使用yield关键字实现提升迭代性能与效率》yield关键字在C#中简化了数据迭代的方式,实现了按需生成数据,自动维护迭代状态,本文主要来聊聊如何使用yield关键字实现提升迭代性能与效率,感兴... 目录前言传统迭代和yield迭代方式对比yield延迟加载按需获取数据yield break显式示迭

Python实现高效地读写大型文件

《Python实现高效地读写大型文件》Python如何读写的是大型文件,有没有什么方法来提高效率呢,这篇文章就来和大家聊聊如何在Python中高效地读写大型文件,需要的可以了解下... 目录一、逐行读取大型文件二、分块读取大型文件三、使用 mmap 模块进行内存映射文件操作(适用于大文件)四、使用 pand

使用SQL语言查询多个Excel表格的操作方法

《使用SQL语言查询多个Excel表格的操作方法》本文介绍了如何使用SQL语言查询多个Excel表格,通过将所有Excel表格放入一个.xlsx文件中,并使用pandas和pandasql库进行读取和... 目录如何用SQL语言查询多个Excel表格如何使用sql查询excel内容1. 简介2. 实现思路3