yield是生成的意思,但是在python中则是作为生成器理解,生成器的用处主要可以迭代,这样简化了很多运算模型(还不是很了解是如何简化的)。
yield是一个表达式,是有返回值的.
当一个函数中含有yield时,它不再是一个普通的函数,而是一个生成器.当该函数被调用时不会自动执行,而是暂停,见第一个例子:
例1:
> def mygenerator(): ... print 'start...' ... yield 5 ... > mygenerator() //在此处调用,并没有打印出start...说明存在yield的函数没有被运行,即暂停 <generator object mygenerator at 0xb762502c> > mygenerator().next() //调用next()即可让函数运行. start... 5 >
如一个函数中出现多个yield则next()会停止在下一个yield前,见例2:
例2:
> def mygenerator(): ... print 'start...' ... yield 5 ... > mygenerator() //在此处调用,并没有打印出start...说明存在yield的函数没有被运行,即暂停 <generator object mygenerator at 0xb762502c> > mygenerator().next() //调用next()即可让函数运行. start... 5 >
为什么yield 5会输出5,yield 23会输出23"htmlcode">
> def fun(): ... print 'start...' ... m = yield 5 ... print m ... print 'middle...' ... d = yield 12 ... print d ... print 'end...' ... > m = fun() //创建一个对象 > m.next() //会使函数执行到下一个yield前 start... 5 > m.send('message') //利用send()传递值 message //send()传递进来的 middle... 12 > m.next() None //可见next()返回值为空 end... Traceback (most recent call last): File "<stdin>", line 1, in <module> StopIteration
在multiprocess中的使用
python在处理数据的时候,memory-heavy 的数据往往会导致程序没办反运行或者运行期间服务器其他程序效率受到影响。这种情况往往会把数据集合变为通过genertor来遍历。
但同时如我们所知,generoter看似只能被单进程消费,这样效率很低。
generator 可以被pool.map消费。
看一下pool.py的源码。
for i, task in enumerate(taskseq): ... try: put(task) except IOError: debug('could not put task on queue') break
实际是先将generator全部消费掉放到queue中。然后通过map来并行。这样是解决了使用map来并行。
但是依然没有解决占用内存的问题。这里有两步占用内存。
- 第一步是全部消费掉的generator。
- 第二步并行运算全部data。
解决第一个问题,通过部分消费generator来达到。
解决第二个问题,可以通过imap来达到.
示例代码如下:
import multiprocessing as mp import itertools import time def g(): for el in xrange(50): print el yield el import os def f(x): time.sleep(1) print str(os.getpid()) +" "+ str(x) return x * x if __name__ == '__main__': pool = mp.Pool(processes=4) # start 4 worker processes go = g() result = [] N = 11 while True: g2 = pool.imap(f, itertools.islice(go, N)) if g2: for i in g2: result.append(i) time.sleep(1) else: break print(result)
ps: 使用注意事项。在produce数据的时候,尽量少做操作,应为即使是map也是单线程的来消费数据。所以尽量把操作放到map中作。这样才能更好的利用多进程提高效率。
风云阁资源网 Design By www.bgabc.com
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
风云阁资源网 Design By www.bgabc.com
暂无评论...
更新日志
2024年11月15日
2024年11月15日
- 炉石传说月初最强卡组有哪些 2024月初最强上分卡组推荐
- 狼人杀亮相原生鸿蒙之夜 假面科技强势登陆华为生态
- 12小时光线挑战!AI画质专家才是大平层首选
- 2024游戏IP报告:1~9月规模1960亿 68%用户愿为之付费
- 群星.2024-今夜一起为爱鼓掌电视剧原声带【相信音乐】【FLAC分轨】
- BIGFOUR.2013-大家利事【寰亚】【WAV+CUE】
- 李美凤.1992-情深透全情歌集【EMI百代】【WAV+CUE】
- 田震2024-《时光音乐会》[金峰][WAV+CUE]
- 群星《监听天碟3》[LECD]限量版[WAV+CUE]
- 心妤《声如夏花HQ》头版限量编号[WAV+CUE]
- 群星《摇滚五杰》[低速原抓WAV+CUE][1.1G]
- 群星 《2024好听新歌30》十倍音质 U盘音乐 [WAV+分轨]
- 群星《试音草原·女声篇》经典蒙古民歌[WAV+CUE][1G]
- 陈慧娴《永远是你的朋友》头版限量编号MQA-UHQCD2024[低速原抓WAV+CUE]
- 曼丽·女人三十《如果·爱》限量1:1母盘直刻[低速原抓WAV+CUE]