(P11-P12)协程,通过信号量控制并发度

2024-06-08 05:38

本文主要是介绍(P11-P12)协程,通过信号量控制并发度,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

    • 1.协程:在单线程内实现并发
    • 2.通过信号量控制并发度

1.协程:在单线程内实现并发

  • 单线程爬虫的执行路径
    在这里插入图片描述
  • 协程:在单线程内实现并发
    核心原理:用一个超级循环(其实就是while true)循环
    核心原理:配合IO多路复用原理(IO时CPU可以干其他事情),等待IO时,切换到下一个
    CPU
    在这里插入图片描述
  • Python 异步IO库介绍:asyncio
    注意:
    (1)要用在异步IO编程中
    依赖的库必须支持异步IO特性
    (2)爬虫引用中:
    requests 不支持异步
    需要用 aiohttp
import asyncio# 获取事件循环
loop = asyncio.get_event_loop()##就是 while True:# 定义协程
async def myfunc(url):await get_url(url)## await目的是IO不进行阻塞,而是让程序进行
下一个loop# 创建task列表
##对多个url进行并发执行
tasks = [loop.create_task(myfunc(url)) for url in urls]# 执行爬虫事件列表
loop.run_until_complete(asyncio.wait(tasks))##执行tasks,等待tasks完成
  • eg:08. async_spider.py
import asyncio
import aiohttp
import blog_spider##协程:在超级循环里可以跑的函数,就是在异步IO中执行async_craw函数
async def async_craw(url):print("craw url: ", url)##async with创建对象async with aiohttp.ClientSession() as session:async with session.get(url) as resp:##resp.text()获取结果result = await resp.text()print(f"craw url: {url}, {len(result)}")##超级循环
loop = asyncio.get_event_loop()##使用协程函数定义一个list
tasks = [loop.create_task(async_craw(url))for url in blog_spider.urls]import timestart = time.time()
##等待tasks完成
loop.run_until_complete(asyncio.wait(tasks))
end = time.time()
print("use time seconds: ", end - start)
  • 测试:
    在这里插入图片描述

2.通过信号量控制并发度

  • 信号量(英语:Semaphore)
    信号量(英语:Semaphore)又称为信号量、旗语
    是一个同步对象,用于保持在0至指定最大值之间的一个计数值。
    当线程完成一次对该semaphore对象的等待(wait)时,该计数值减一;
    当线程完成一次对semaphore对象的释放(release)时,计数值加一。
    当计数值为0,则线程等待该semaphore对象不再能成功直至该semaphore对象变成signaled状态
    semaphore对象的计数值大于0,为signaled状态;计数值等于0,为nonsignaled状态.

  • 语法

方法1##10就是并发量的意思
sem = asyncio.Semaphore(10)# ... later
async with sem:# work with shared resource方法2:
sem = asyncio.Semaphore(10)# ... later
await sem.acquire()
try:# work with shared resource
finally:sem.release()
  • eg:
import asyncio
import aiohttp
import blog_spider##并发度10
semaphore = asyncio.Semaphore(10)async def async_craw(url):async with semaphore:print("craw url: ", url)async with aiohttp.ClientSession() as session:async with session.get(url) as resp:result = await resp.text()await asyncio.sleep(5)print(f"craw url: {url}, {len(result)}")loop = asyncio.get_event_loop()tasks = [loop.create_task(async_craw(url))for url in blog_spider.urls]import timestart = time.time()
loop.run_until_complete(asyncio.wait(tasks))
end = time.time()
print("use time seconds: ", end - start)
  • 测试:10个10个进行爬取
    在这里插入图片描述

  • 参考:链接

这篇关于(P11-P12)协程,通过信号量控制并发度的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1041332

相关文章

用js控制视频播放进度基本示例代码

《用js控制视频播放进度基本示例代码》写前端的时候,很多的时候是需要支持要网页视频播放的功能,下面这篇文章主要给大家介绍了关于用js控制视频播放进度的相关资料,文中通过代码介绍的非常详细,需要的朋友可... 目录前言html部分:JavaScript部分:注意:总结前言在javascript中控制视频播放

Java并发编程必备之Synchronized关键字深入解析

《Java并发编程必备之Synchronized关键字深入解析》本文我们深入探索了Java中的Synchronized关键字,包括其互斥性和可重入性的特性,文章详细介绍了Synchronized的三种... 目录一、前言二、Synchronized关键字2.1 Synchronized的特性1. 互斥2.

Android Kotlin 高阶函数详解及其在协程中的应用小结

《AndroidKotlin高阶函数详解及其在协程中的应用小结》高阶函数是Kotlin中的一个重要特性,它能够将函数作为一等公民(First-ClassCitizen),使得代码更加简洁、灵活和可... 目录1. 引言2. 什么是高阶函数?3. 高阶函数的基础用法3.1 传递函数作为参数3.2 Lambda

Python异步编程中asyncio.gather的并发控制详解

《Python异步编程中asyncio.gather的并发控制详解》在Python异步编程生态中,asyncio.gather是并发任务调度的核心工具,本文将通过实际场景和代码示例,展示如何结合信号量... 目录一、asyncio.gather的原始行为解析二、信号量控制法:给并发装上"节流阀"三、进阶控制

Redis中高并发读写性能的深度解析与优化

《Redis中高并发读写性能的深度解析与优化》Redis作为一款高性能的内存数据库,广泛应用于缓存、消息队列、实时统计等场景,本文将深入探讨Redis的读写并发能力,感兴趣的小伙伴可以了解下... 目录引言一、Redis 并发能力概述1.1 Redis 的读写性能1.2 影响 Redis 并发能力的因素二、

使用DrissionPage控制360浏览器的完美解决方案

《使用DrissionPage控制360浏览器的完美解决方案》在网页自动化领域,经常遇到需要保持登录状态、保留Cookie等场景,今天要分享的方案可以完美解决这个问题:使用DrissionPage直接... 目录完整代码引言为什么要使用已有用户数据?核心代码实现1. 导入必要模块2. 关键配置(重点!)3.

SpringSecurity 认证、注销、权限控制功能(注销、记住密码、自定义登入页)

《SpringSecurity认证、注销、权限控制功能(注销、记住密码、自定义登入页)》SpringSecurity是一个强大的Java框架,用于保护应用程序的安全性,它提供了一套全面的安全解决方案... 目录简介认识Spring Security“认证”(Authentication)“授权” (Auth

python之流程控制语句match-case详解

《python之流程控制语句match-case详解》:本文主要介绍python之流程控制语句match-case使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录match-case 语法详解与实战一、基础值匹配(类似 switch-case)二、数据结构解构匹

Spring Security注解方式权限控制过程

《SpringSecurity注解方式权限控制过程》:本文主要介绍SpringSecurity注解方式权限控制过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、摘要二、实现步骤2.1 在配置类中添加权限注解的支持2.2 创建Controller类2.3 Us

Nginx实现高并发的项目实践

《Nginx实现高并发的项目实践》本文主要介绍了Nginx实现高并发的项目实践,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录使用最新稳定版本的Nginx合理配置工作进程(workers)配置工作进程连接数(worker_co