13.爬虫---PyMongo安装与使用

2024-06-23 15:44
文章标签 安装 使用 爬虫 13 pymongo

本文主要是介绍13.爬虫---PyMongo安装与使用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

13.PyMongo安装与使用

    • 1.安装 PyMongo
    • 2.使用PyMongo
      • 2.1连接数据库和集合
      • 2.2增加数据
      • 2.3修改数据
      • 2.4查询数据
      • 2.5删除数据
    • 3.总结

MongoDB 安装可以看这篇文章MongoDB安装配置教程(详细版)

1.安装 PyMongo

PyMongo 是Python中用于连接MongoDB数据库的库,安装起来非常简单。通常情况下,只需要在命令行中执行以下命令即可:

pip install PyMongo

如果你使用的是Python 3,可能需要使用pip3来安装:

pip3 install PyMongo

2.使用PyMongo

使用 PyMongo 连接 MongoDB 的第一步是创建一个 MongoClient 对象。可以通过以下方式创建连接

2.1连接数据库和集合

import pymongomongo = pymongo.MongoClient('localhost', 27017)
# 选择数据库
db = mongo.test
print(db)
col = db.table
print(col)

在这里插入图片描述

执行结果:

Database(MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True), 'test')
Collection(Database(MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True), 'test'), 'table')

2.2增加数据

插入文档可以使用 insert_one()insert_many() 方法

1.insert_one() 添加一个

# 添加
import pymongomongo = pymongo.MongoClient('localhost', 27017)
# 选择数据库
db = mongo.test
col = db.table
col.insert_one({"name": "John",'age':23}) #添加一个

执行结果:
在这里插入图片描述

2.insert_many() 添加一些

col.insert_many([{"name": "John",'age':23},{"name": "Jane",'age':24},{"name": "bob",'age':25}])

执行结果:
在这里插入图片描述

2.3修改数据

常见参数包括:

  • filter:定义了更新条件的查询对象。
  • update:包含了更新内容的对象,通常使用 $set 操作符来更新字段。
  • **kwargs:可选参数,如 upsert (在未找到匹配文档时的插入行为) 等。

更新数据可以使用 update_one()update_many() 方法:

1.update_one() 更新一个,我们更新 name=John 的 age=30

# 修改
col.update_one({"name": "John"}, {"$set": {"age": 30}})

执行结果:
在这里插入图片描述
2.update_many() 更新一些 我们更新 name=John 的 age=31

# 修改
col.update_many()({"name": "John"}, {"$set": {"age": 30}})

执行结果:
在这里插入图片描述

2.4查询数据

常见参数包括:

  • filter: 查询条件,用于指定要检索的文档。
  • projection: 投影条件,用于指定要返回的字段。
  • sort: 排序条件,用于指定返回文档的排序方式。
  • skip: 跳过的文档数量。
  • limit: 返回文档的最大数量。
  • batch_size: 每次从服务器读取的文档数量。
  • max_time_ms: 查询的最大执行时间(毫秒)。

1.查询所有

results = col.find()

执行结果:

{'_id': ObjectId('6677b7d499f1e427419c2d07'), 'name': 'John', 'age': 31}
{'_id': ObjectId('6677b91125406ce9b6fae3ea'), 'name': 'John', 'age': 31}
{'_id': ObjectId('6677b91125406ce9b6fae3eb'), 'name': 'Jane', 'age': 24}
{'_id': ObjectId('6677b91125406ce9b6fae3ec'), 'name': 'bob', 'age': 25}

2.查询 name = bob 的数据

result = col.find({'name':'bob'})
print(list(result))

执行结果:

[{'_id': ObjectId('6677b91125406ce9b6fae3ec'), 'name': 'bob', 'age': 25}]

3.使用 $gt 运算符来查询年龄大于20岁的学生,并指定返回结果中包含的字段。同时,我们指定了排序和跳过的文档数量,以及限制返回文档的数量

results = col.find({"age": {"$gt": 20}}, {"_id": 0, "name": 1, "age": 1}).sort("age", pymongo.ASCENDING).skip(1).limit(3)

执行结果:

{'name': 'bob', 'age': 25}
{'name': 'John', 'age': 31}
{'name': 'John', 'age': 31}

在这里插入图片描述

2.5删除数据

PyMongo 提供了 delete_one() delete_many() 方法来删除 MongoDB 集合中的文档

1.delete_one() 删除 name = bob 的 数据

results = col.delete_one({'name': 'bob'})
print(results)

执行结果:

DeleteResult({'n': 1, 'ok': 1.0}, acknowledged=True)

在这里插入图片描述
2.delete_many() 删除 name = John 的 数据

results = col.delete_many()({'name': 'John'})
print(results)

执行结果:

DeleteResult({'n': 2, 'ok': 1.0}, acknowledged=True)

在这里插入图片描述

3.总结

PyMongo 为 Python 程序员提供了一个强大且易于使用的 MongoDB 接口。通过上述教程,你可以学会如何安装 PyMongo、连接 MongoDB、创建数据库和集合、插入和查询文档、更新和删除数据,以及如何对结果进行排序、跳过和限制。这些操作构成了与 MongoDB 数据库交互的基础。

这篇关于13.爬虫---PyMongo安装与使用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1087581

相关文章

Zookeeper安装和配置说明

一、Zookeeper的搭建方式 Zookeeper安装方式有三种,单机模式和集群模式以及伪集群模式。 ■ 单机模式:Zookeeper只运行在一台服务器上,适合测试环境; ■ 伪集群模式:就是在一台物理机上运行多个Zookeeper 实例; ■ 集群模式:Zookeeper运行于一个集群上,适合生产环境,这个计算机集群被称为一个“集合体”(ensemble) Zookeeper通过复制来实现

CentOS7安装配置mysql5.7 tar免安装版

一、CentOS7.4系统自带mariadb # 查看系统自带的Mariadb[root@localhost~]# rpm -qa|grep mariadbmariadb-libs-5.5.44-2.el7.centos.x86_64# 卸载系统自带的Mariadb[root@localhost ~]# rpm -e --nodeps mariadb-libs-5.5.44-2.el7

Centos7安装Mongodb4

1、下载源码包 curl -O https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-rhel70-4.2.1.tgz 2、解压 放到 /usr/local/ 目录下 tar -zxvf mongodb-linux-x86_64-rhel70-4.2.1.tgzmv mongodb-linux-x86_64-rhel70-4.2.1/

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

Java进阶13讲__第12讲_1/2

多线程、线程池 1.  线程概念 1.1  什么是线程 1.2  线程的好处 2.   创建线程的三种方式 注意事项 2.1  继承Thread类 2.1.1 认识  2.1.2  编码实现  package cn.hdc.oop10.Thread;import org.slf4j.Logger;import org.slf4j.LoggerFactory

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

Centos7安装JDK1.8保姆版

工欲善其事,必先利其器。这句话同样适用于学习Java编程。在开始Java的学习旅程之前,我们必须首先配置好适合的开发环境。 通过事先准备好这些工具和配置,我们可以避免在学习过程中遇到因环境问题导致的代码异常或错误。一个稳定、高效的开发环境能够让我们更加专注于代码的学习和编写,提升学习效率,减少不必要的困扰和挫折感。因此,在学习Java之初,投入一些时间和精力来配置好开发环境是非常值得的。这将为我