资讯专栏INFORMATION COLUMN

网络异步请求之gevent

pcChao / 2906人阅读

摘要:我们知道对于网络请求这种的场景来说,最怕的就是某个请求阻塞了其余的操作,让并发性大大降低。同步首先我们来看看传统的请求。结论我又多试了几次,的效率确实牛,远远高于同步请求。

我们知道对于网络请求这种IO bound的场景来说,最怕的就是某个请求阻塞了其余的操作,让并发性大大降低。今天就来介绍一款python下的并发库-gevent。

首先看一下他自己的介绍:

gevent是一个基于libev的并发库。它为各种并发和网络相关的任务提供了整洁的API。

嗯,确实很简洁,很易使用。待会我们就见识到了。

同步IO

首先我们来看看传统的IO请求。
比如我们请求:http://httpbin.org/ip 发个http get请求会得到我们的ip地址,如:

{
  "origin": "183.240.202.14"
}

我们来写个脚本连续发50个get请求到这个地址,以模拟多个请求。(脚本命名为get.py)

import requests

url = "http://httpbin.org/ip"

for i in range(50):
    print("{}: {}".format(i, requests.get(url).text))

统计一下运行时间:

$ time python3 get.py

(输出略...)
python3 get.py  0.56s user 0.06s system 1% cpu 35.606 total

大概花费35s钟,当然不同网络环境可能结果不同。而且打印出来的结果是按照1, 2, 3...50这样的顺序来的,说明整个请求是同步的,一个请求结束再发下一个请求。

使用gevent

我们再来写一个gevent版的get.py,命名为gevent_get.py

import requests
import gevent
import gevent.monkey
# 这里将socket变成异步
gevent.monkey.patch_socket()

url = "http://httpbin.org/ip"


def hello(i):
    print("{}: {}".format(i, requests.get(url).text))


tasks = [gevent.spawn(hello, i) for i in range(50)]
gevent.joinall(tasks)

再来看看运行时间:

$ time python3 gevent_get.py

(输出略...)
python3 gevent_get.py  0.49s user 0.06s system 39% cpu 1.403 total

我的天!才1.4秒左右,而且打印出来的结果没有按照1, 2, 3...50这样排列,而是按照随机顺序排列的,说明整个请求是异步非阻塞的。

结论

我又多试了几次,gevent的效率确实牛,远远高于同步io请求。最近在我的一个爬虫小项目里面用进程池 + gevent,爬取80个页面,大概花费40s左右,每个页面只要0.5s,而且还包括DOM解析的时间,而用同步请求则花费大概300s左右。

gevent的更多用法请参考其官方文档。这么简单又好用的库赶紧试试吧。^_^

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/45515.html

相关文章

  • Python协程(真才实学,想学的进来)

    摘要:所以与多线程相比,线程的数量越多,协程性能的优势越明显。值得一提的是,在此过程中,只有一个线程在执行,因此这与多线程的概念是不一样的。 真正有知识的人的成长过程,就像麦穗的成长过程:麦穗空的时候,麦子长得很快,麦穗骄傲地高高昂起,但是,麦穗成熟饱满时,它们开始谦虚,垂下麦芒。 ——蒙田《蒙田随笔全集》 上篇论述了关于python多线程是否是鸡肋的问题,得到了一些网友的认可,当然也有...

    lykops 评论0 收藏0
  • 一起读 Gevent 源码

    摘要:一旦有事件产生可能是一次出现好多个事件,就会按照优先级依次调用每个事件的回调函数。注意,是有超时的,所以一些无法以文件描述符的形式存在的事件也可以有机会被触发。 这一篇主要想跟大家分享一下 Gevent 实现的基础逻辑,也是有同学对这个很感兴趣,所以贴出来跟大家一起分享一下。 Greenlet 我们知道 Gevent 是基于 Greenlet 实现的,greenlet 有的时候也被...

    tainzhi 评论0 收藏0
  • python基础教程:异步IO 概念和历史

    摘要:并发的方式有多种,多线程,多进程,异步等。多线程和多进程之间的场景切换和通讯代价很高,不适合密集型的场景关于多线程和多进程的特点已经超出本文讨论的范畴,有兴趣的同学可以自行搜索深入理解。 编程中,我们经常会遇到并发这个概念,目的是让软件能充分利用硬件资源,提高性能。并发的方式有多种,多线程,多进程,异步IO等。多线程和多进程更多应用于CPU密集型的场景,比如科学计算的时间都耗费在CPU...

    BicycleWarrior 评论0 收藏0
  • 谈谈Python协程技术的演进

    摘要:事件循环是异步编程的底层基石。对事件集合进行轮询,调用回调函数等一轮事件循环结束,循环往复。协程直接利用代码的执行位置来表示状态,而回调则是维护了一堆数据结构来处理状态。时代的协程技术主要是,另一个比较小众。 Coding Crush Python开发工程师 主要负责岂安科技业务风险情报系统redq。 引言 1.1. 存储器山 存储器山是 Randal Bryant 在《深入...

    zhiwei 评论0 收藏0
  • python---协程

    摘要:随着我们对于效率的追求不断提高,基于单线程来实现并发又成为一个新的课题,即只用一个主线程很明显可利用的只有一个情况下实现并发。作为的补充可以检测操作,在遇到操作的情况下才发生切换协程介绍协程是单线程下的并发,又称微线程,纤程。 引子 之前我们学习了线程、进程的概念,了解了在操作系统中进程是资源分配的最小单位,线程是CPU调度的最小单位。按道理来说我们已经算是把cpu的利用率提高很多了。...

    lolomaco 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<