13.爬虫---PyMongo安装与使用

2024-06-23 15:44
文章标签 安装 使用 爬虫 13 pymongo

本文主要是介绍13.爬虫---PyMongo安装与使用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

13.PyMongo安装与使用

    • 1.安装 PyMongo
    • 2.使用PyMongo
      • 2.1连接数据库和集合
      • 2.2增加数据
      • 2.3修改数据
      • 2.4查询数据
      • 2.5删除数据
    • 3.总结

MongoDB 安装可以看这篇文章MongoDB安装配置教程(详细版)

1.安装 PyMongo

PyMongo 是Python中用于连接MongoDB数据库的库,安装起来非常简单。通常情况下,只需要在命令行中执行以下命令即可:

pip install PyMongo

如果你使用的是Python 3,可能需要使用pip3来安装:

pip3 install PyMongo

2.使用PyMongo

使用 PyMongo 连接 MongoDB 的第一步是创建一个 MongoClient 对象。可以通过以下方式创建连接

2.1连接数据库和集合

import pymongomongo = pymongo.MongoClient('localhost', 27017)
# 选择数据库
db = mongo.test
print(db)
col = db.table
print(col)

在这里插入图片描述

执行结果:

Database(MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True), 'test')
Collection(Database(MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True), 'test'), 'table')

2.2增加数据

插入文档可以使用 insert_one()insert_many() 方法

1.insert_one() 添加一个

# 添加
import pymongomongo = pymongo.MongoClient('localhost', 27017)
# 选择数据库
db = mongo.test
col = db.table
col.insert_one({"name": "John",'age':23}) #添加一个

执行结果:
在这里插入图片描述

2.insert_many() 添加一些

col.insert_many([{"name": "John",'age':23},{"name": "Jane",'age':24},{"name": "bob",'age':25}])

执行结果:
在这里插入图片描述

2.3修改数据

常见参数包括:

  • filter:定义了更新条件的查询对象。
  • update:包含了更新内容的对象,通常使用 $set 操作符来更新字段。
  • **kwargs:可选参数,如 upsert (在未找到匹配文档时的插入行为) 等。

更新数据可以使用 update_one()update_many() 方法:

1.update_one() 更新一个,我们更新 name=John 的 age=30

# 修改
col.update_one({"name": "John"}, {"$set": {"age": 30}})

执行结果:
在这里插入图片描述
2.update_many() 更新一些 我们更新 name=John 的 age=31

# 修改
col.update_many()({"name": "John"}, {"$set": {"age": 30}})

执行结果:
在这里插入图片描述

2.4查询数据

常见参数包括:

  • filter: 查询条件,用于指定要检索的文档。
  • projection: 投影条件,用于指定要返回的字段。
  • sort: 排序条件,用于指定返回文档的排序方式。
  • skip: 跳过的文档数量。
  • limit: 返回文档的最大数量。
  • batch_size: 每次从服务器读取的文档数量。
  • max_time_ms: 查询的最大执行时间(毫秒)。

1.查询所有

results = col.find()

执行结果:

{'_id': ObjectId('6677b7d499f1e427419c2d07'), 'name': 'John', 'age': 31}
{'_id': ObjectId('6677b91125406ce9b6fae3ea'), 'name': 'John', 'age': 31}
{'_id': ObjectId('6677b91125406ce9b6fae3eb'), 'name': 'Jane', 'age': 24}
{'_id': ObjectId('6677b91125406ce9b6fae3ec'), 'name': 'bob', 'age': 25}

2.查询 name = bob 的数据

result = col.find({'name':'bob'})
print(list(result))

执行结果:

[{'_id': ObjectId('6677b91125406ce9b6fae3ec'), 'name': 'bob', 'age': 25}]

3.使用 $gt 运算符来查询年龄大于20岁的学生,并指定返回结果中包含的字段。同时,我们指定了排序和跳过的文档数量,以及限制返回文档的数量

results = col.find({"age": {"$gt": 20}}, {"_id": 0, "name": 1, "age": 1}).sort("age", pymongo.ASCENDING).skip(1).limit(3)

执行结果:

{'name': 'bob', 'age': 25}
{'name': 'John', 'age': 31}
{'name': 'John', 'age': 31}

在这里插入图片描述

2.5删除数据

PyMongo 提供了 delete_one() delete_many() 方法来删除 MongoDB 集合中的文档

1.delete_one() 删除 name = bob 的 数据

results = col.delete_one({'name': 'bob'})
print(results)

执行结果:

DeleteResult({'n': 1, 'ok': 1.0}, acknowledged=True)

在这里插入图片描述
2.delete_many() 删除 name = John 的 数据

results = col.delete_many()({'name': 'John'})
print(results)

执行结果:

DeleteResult({'n': 2, 'ok': 1.0}, acknowledged=True)

在这里插入图片描述

3.总结

PyMongo 为 Python 程序员提供了一个强大且易于使用的 MongoDB 接口。通过上述教程,你可以学会如何安装 PyMongo、连接 MongoDB、创建数据库和集合、插入和查询文档、更新和删除数据,以及如何对结果进行排序、跳过和限制。这些操作构成了与 MongoDB 数据库交互的基础。

这篇关于13.爬虫---PyMongo安装与使用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1087581

相关文章

Java中String字符串使用避坑指南

《Java中String字符串使用避坑指南》Java中的String字符串是我们日常编程中用得最多的类之一,看似简单的String使用,却隐藏着不少“坑”,如果不注意,可能会导致性能问题、意外的错误容... 目录8个避坑点如下:1. 字符串的不可变性:每次修改都创建新对象2. 使用 == 比较字符串,陷阱满

Python使用国内镜像加速pip安装的方法讲解

《Python使用国内镜像加速pip安装的方法讲解》在Python开发中,pip是一个非常重要的工具,用于安装和管理Python的第三方库,然而,在国内使用pip安装依赖时,往往会因为网络问题而导致速... 目录一、pip 工具简介1. 什么是 pip?2. 什么是 -i 参数?二、国内镜像源的选择三、如何

使用C++实现链表元素的反转

《使用C++实现链表元素的反转》反转链表是链表操作中一个经典的问题,也是面试中常见的考题,本文将从思路到实现一步步地讲解如何实现链表的反转,帮助初学者理解这一操作,我们将使用C++代码演示具体实现,同... 目录问题定义思路分析代码实现带头节点的链表代码讲解其他实现方式时间和空间复杂度分析总结问题定义给定

Linux使用nload监控网络流量的方法

《Linux使用nload监控网络流量的方法》Linux中的nload命令是一个用于实时监控网络流量的工具,它提供了传入和传出流量的可视化表示,帮助用户一目了然地了解网络活动,本文给大家介绍了Linu... 目录简介安装示例用法基础用法指定网络接口限制显示特定流量类型指定刷新率设置流量速率的显示单位监控多个

JavaScript中的reduce方法执行过程、使用场景及进阶用法

《JavaScript中的reduce方法执行过程、使用场景及进阶用法》:本文主要介绍JavaScript中的reduce方法执行过程、使用场景及进阶用法的相关资料,reduce是JavaScri... 目录1. 什么是reduce2. reduce语法2.1 语法2.2 参数说明3. reduce执行过程

如何使用Java实现请求deepseek

《如何使用Java实现请求deepseek》这篇文章主要为大家详细介绍了如何使用Java实现请求deepseek功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1.deepseek的api创建2.Java实现请求deepseek2.1 pom文件2.2 json转化文件2.2

python使用fastapi实现多语言国际化的操作指南

《python使用fastapi实现多语言国际化的操作指南》本文介绍了使用Python和FastAPI实现多语言国际化的操作指南,包括多语言架构技术栈、翻译管理、前端本地化、语言切换机制以及常见陷阱和... 目录多语言国际化实现指南项目多语言架构技术栈目录结构翻译工作流1. 翻译数据存储2. 翻译生成脚本

C++ Primer 多维数组的使用

《C++Primer多维数组的使用》本文主要介绍了多维数组在C++语言中的定义、初始化、下标引用以及使用范围for语句处理多维数组的方法,具有一定的参考价值,感兴趣的可以了解一下... 目录多维数组多维数组的初始化多维数组的下标引用使用范围for语句处理多维数组指针和多维数组多维数组严格来说,C++语言没

在 Spring Boot 中使用 @Autowired和 @Bean注解的示例详解

《在SpringBoot中使用@Autowired和@Bean注解的示例详解》本文通过一个示例演示了如何在SpringBoot中使用@Autowired和@Bean注解进行依赖注入和Bean... 目录在 Spring Boot 中使用 @Autowired 和 @Bean 注解示例背景1. 定义 Stud

使用 sql-research-assistant进行 SQL 数据库研究的实战指南(代码实现演示)

《使用sql-research-assistant进行SQL数据库研究的实战指南(代码实现演示)》本文介绍了sql-research-assistant工具,该工具基于LangChain框架,集... 目录技术背景介绍核心原理解析代码实现演示安装和配置项目集成LangSmith 配置(可选)启动服务应用场景