久久国产乱子伦精品免费M,亚洲一区二区三区91,欧美国产在线视频,国产精品视频久久

Python函數(shù)式編程指南(三):迭代器

這一篇我們將討論迭代器。迭代器并不是函數(shù)式編程特有的東西,但它仍然是函數(shù)式編程的一個重要的組成部分,或者說是一個重要的工具。

轉(zhuǎn)載請注明原作者和原文地址:)

3. 迭代器

3.1. 迭代器(Iterator)概述

迭代器是訪問集合內(nèi)元素的一種方式。迭代器對象從集合的第一個元素開始訪問,直到所有的元素都被訪問一遍后結(jié)束。

迭代器不能回退,只能往前進行迭代。這并不是什么很大的缺點,因為人們幾乎不需要在迭代途中進行回退操作。

迭代器也不是線程安全的,在多線程環(huán)境中對可變集合使用迭代器是一個危險的操作。但如果小心謹慎,或者干脆貫徹函數(shù)式思想堅持使用不可變的集合,那這也不是什么大問題。

對于原生支持隨機訪問的數(shù)據(jù)結(jié)構(gòu)(如tuple、list),迭代器和經(jīng)典for循環(huán)的索引訪問相比并無優(yōu)勢,反而丟失了索引值(可以使用內(nèi)建函數(shù)enumerate()找回這個索引值,這是后話)。但對于無法隨機訪問的數(shù)據(jù)結(jié)構(gòu)(比如set)而言,迭代器是唯一的訪問元素的方式。

迭代器的另一個優(yōu)點就是它不要求你事先準備好整個迭代過程中所有的元素。迭代器僅僅在迭代至某個元素時才計算該元素,而在這之前或之后,元素可以不存在或者被銷毀。這個特點使得它特別適合用于遍歷一些巨大的或是無限的集合,比如幾個G的文件,或是斐波那契數(shù)列等等。這個特點被稱為延遲計算或惰性求值(Lazy evaluation)。

迭代器更大的功勞是提供了一個統(tǒng)一的訪問集合的接口。只要是實現(xiàn)了__iter__()方法的對象,就可以使用迭代器進行訪問。

3.2. 使用迭代器

使用內(nèi)建的工廠函數(shù)iter(iterable)可以獲取迭代器對象:

>>> lst = range(2)
>>> it = iter(lst)
>>> it
<listiterator object at 0x00BB62F0> 

使用迭代器的next()方法可以訪問下一個元素:
>>> it.next()

如果是Python 2.6+,還有內(nèi)建函數(shù)next(iterator)可以完成這一功能:

>>> next(it) 

如何判斷迭代器還有更多的元素可以訪問呢?Python里的迭代器并沒有提供類似has_next()這樣的方法。
那么在這個例子中,我們已經(jīng)訪問到了最后一個元素1,再使用next()方法會怎樣呢?
>>> it.next() 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
StopIteration 

Python遇到這樣的情況時將會拋出StopIteration異常。事實上,Python正是根據(jù)是否檢查到這個異常來決定是否停止迭代的。
這種做法與迭代前手動檢查是否越界相比各有優(yōu)點。但Python的做法總有一些利用異常進行流程控制的嫌疑。

了解了這些情況以后,我們就能使用迭代器進行遍歷了。

it = iter(lst)
try:
while True:
val = it.next()
print val
except StopIteration:
pass 

實際上,因為迭代操作如此普遍,Python專門將關(guān)鍵字for用作了迭代器的語法糖。在for循環(huán)中,Python將自動調(diào)用工廠函數(shù)iter()獲得迭代器,自動調(diào)用next()獲取元素,還完成了檢查StopIteration異常的工作。上述代碼可以寫成如下的形式,你一定非常熟悉:
 
 
for val in lst:
print val 

首先Python將對關(guān)鍵字in后的對象調(diào)用iter函數(shù)獲取迭代器,然后調(diào)用迭代器的next方法獲取元素,直到拋出StopIteration異常。對迭代器調(diào)用iter函數(shù)時將返回迭代器自身,所以迭代器也可以用于for語句中,不需要特殊處理。

常用的幾個內(nèi)建數(shù)據(jù)結(jié)構(gòu)tuple、list、set、dict都支持迭代器,字符串也可以使用迭代操作。你也可以自己實現(xiàn)一個迭代器,如上所述,只需要在類的__iter__方法中返回一個對象,這個對象擁有一個next()方法,這個方法能在恰當?shù)臅r候拋出StopIteration異常即可。但是需要自己實現(xiàn)迭代器的時候不多,即使需要,使用生成器會更輕松。下一篇我們將討論生成器的部分。

*異常并不是非拋出不可的,不拋出該異常的迭代器將進行無限迭代,某些情況下這樣的迭代器很有用。這種情況下,你需要自己判斷元素并中止,否則就死循環(huán)了!

使用迭代器的循環(huán)可以避開索引,但有時候我們還是需要索引來進行一些操作的。這時候內(nèi)建函數(shù)enumerate就派上用場咯,它能在iter函數(shù)的結(jié)果前加上索引,以元組返回,用起來就像這樣:

for idx, ele in enumerate(lst):
print idx, ele 

3.3. 生成器表達式(Generator expression)和列表解析(List Comprehension)

絕大多數(shù)情況下,遍歷一個集合都是為了對元素應用某個動作或是進行篩選。如果看過本文的第二部分,你應該還記得有內(nèi)建函數(shù)map和filter提供了這些功能,但Python仍然為這些操作提供了語言級的支持。

(x+1 for x in lst) #生成器表達式,返回迭代器。外部的括號可在用于參數(shù)時省略。 
[x+1 for x in lst] #列表解析,返回list 

如你所見,生成器表達式和列表解析(注:這里的翻譯有很多種,比如列表展開、列表推導等等,指的是同一個意思)的區(qū)別很小,所以人們提到這個特性時,簡單起見往往只描述成列表解析。然而由于返回迭代器時,并不是在一開始就計算所有的元素,這樣能得到更多的靈活性并且可以避開很多不必要的計算,所以除非你明確希望返回列表,否則應該始終使用生成器表達式。接下來的文字里我就不區(qū)分這兩種形式了:)

你也可以為列表解析提供if子句進行篩選:

(x+1 for x in lst if x!=0) 

或者提供多條for子句進行嵌套循環(huán),嵌套次序就是for子句的順序:
((x, y) for x in range(3) for y in range(x)) 

列表解析就是鮮明的Pythonic。我常遇到兩個使用列表解析的問題,本應歸屬于最佳實踐,但這兩個問題非常典型,所以不妨在這里提一下:

第一個問題是,因為對元素應用的動作太復雜,不能用一個表達式寫出來,所以不使用列表解析。這是典型的思想沒有轉(zhuǎn)變的例子,如果我們將動作封裝成函數(shù),那不就是一個表達式了么?

第二個問題是,因為if子句里的條件需要計算,同時結(jié)果也需要進行同樣的計算,不希望計算兩遍,就像這樣:

(x.doSomething() for x in lst if x.doSomething()>0) 

這樣寫確實很糟糕,但組合一下列表解析即可解決:
(x for x in (y.doSomething() for y in lst) if x>0)

內(nèi)部的列表解析變量其實也可以用x,但為清晰起見我們改成了y?;蛘吒宄?,可以寫成兩個表達式:

tmp = (x.doSomething() for x in lst)
(x for x in tmp if x > 0) 

列表解析可以替代絕大多數(shù)需要用到map和filter的場合,可能正因為此,著名的靜態(tài)檢查工具pylint將map和filter的使用列為了警告。
3.4. 相關(guān)的庫

Python內(nèi)置了一個模塊itertools,包含了很多函數(shù)用于creating iterators for efficient looping(創(chuàng)建更有效率的循環(huán)迭代器),這說明很是霸氣,這一小節(jié)就來瀏覽一遍這些函數(shù)并留下印象吧,需要這些功能的時候隱約記得這里面有就好。這一小節(jié)的內(nèi)容翻譯自itertools模塊官方文檔。

3.4.1. 無限迭代
  • count(start, [step])
    從start開始,以后每個元素都加上step。step默認值為1。
    count(10) --> 10 11 12 13 14 ...
  • cycle(p)
    迭代至序列p的最后一個元素后,從p的第一個元素重新開始。
    cycle('ABCD') --> A B C D A B C D ...
  • repeat(elem [,n])
    將elem重復n次。如果不指定n,則無限重復。
    repeat(10, 3) --> 10 10 10
3.4.2. 在最短的序列參數(shù)終止時停止迭代
  • chain(p, q, ...)
    迭代至序列p的最后一個元素后,從q的第一個元素開始,直到所有序列終止。
    chain('ABC', 'DEF') --> A B C D E F
  • compress(data, selectors)
    如果bool(selectors[n])為True,則next()返回data[n],否則跳過data[n]。
    compress('ABCDEF', [1,0,1,0,1,1]) --> A C E F
  • dropwhile(pred, seq)
    當pred對seq[n]的調(diào)用返回False時才開始迭代。
    dropwhile(lambda x: x<5, [1,4,6,4,1]) --> 6 4 1
  • takewhile(pred, seq)
    dropwhile的相反版本。
    takewhile(lambda x: x<5, [1,4,6,4,1]) --> 1 4
  • ifilter(pred, seq)
    內(nèi)建函數(shù)filter的迭代器版本。
    ifilter(lambda x: x%2, range(10)) --> 1 3 5 7 9
  • ifilterfalse(pred, seq)
    ifilter的相反版本。
    ifilterfalse(lambda x: x%2, range(10)) --> 0 2 4 6 8
  • imap(func, p, q, ...)
    內(nèi)建函數(shù)map的迭代器版本。
    imap(pow, (2,3,10), (5,2,3)) --> 32 9 1000
  • starmap(func, seq)
    將seq的每個元素以變長參數(shù)(*args)的形式調(diào)用func。
    starmap(pow, [(2,5), (3,2), (10,3)]) --> 32 9 1000
  • izip(p, q, ...)
    內(nèi)建函數(shù)zip的迭代器版本。
    izip('ABCD', 'xy') --> Ax By
  • izip_longest(p, q, ..., fillvalue=None)
    izip的取最長序列的版本,短序列將填入fillvalue。
    izip_longest('ABCD', 'xy', fillvalue='-') --> Ax By C- D-
  • tee(it, n)
    返回n個迭代器it的復制迭代器。
  • groupby(iterable[, keyfunc])
    這個函數(shù)功能類似于SQL的分組。使用groupby前,首先需要使用相同的keyfunc對iterable進行排序,比如調(diào)用內(nèi)建的sorted函數(shù)。然后,groupby返回迭代器,每次迭代的元素是元組(key值, iterable中具有相同key值的元素的集合的子迭代器)?;蛟S看看Python的排序指南對理解這個函數(shù)有幫助。
    groupby([0, 0, 0, 1, 1, 1, 2, 2, 2]) --> (0, (0 0 0)) (1, (1 1 1)) (2, (2 2 2))
3.4.3. 組合迭代器
  • product(p, q, ... [repeat=1])
    笛卡爾積。
    product('ABCD', repeat=2) --> AA AB AC AD BA BB BC BD CA CB CC CD DA DB DC DD
  • permutations(p[, r])
    去除重復的元素。
    permutations('ABCD', 2) --> AB AC AD BA BC BD CA CB CD DA DB DC
  • combinations(p, r)
    排序后去除重復的元素。
    combinations('ABCD', 2) --> AB AC AD BC BD CD
  • combinations_with_replacement()
    排序后,包含重復元素。
    combinations_with_replacement('ABCD', 2) --> AA AB AC AD BB BC BD CC CD DD

此篇結(jié)束。

     

       轉(zhuǎn)自:http://www.cnblogs.com/huxi/archive/2011/07/01/2095931.html

相關(guān)新聞

歷經(jīng)多年發(fā)展,已成為國內(nèi)好評如潮的Linux云計算運維、SRE、Devops、網(wǎng)絡安全、云原生、Go、Python開發(fā)專業(yè)人才培訓機構(gòu)!

    1. 主站蜘蛛池模板: 宜昌市| 克拉玛依市| 定结县| 德保县| 拉萨市| 阿鲁科尔沁旗| 安庆市| 五寨县| 牟定县| 丰顺县| 襄汾县| 江陵县| 田阳县| 开封县| 深圳市| 聊城市| 固原市| 安康市| 木兰县| 措美县| 乌兰察布市| 洪雅县| 当雄县| 甘泉县| 疏勒县| 民丰县| 靖远县| 五大连池市| 临澧县| 建瓯市| 凉城县| 游戏| 罗城| 黄石市| 临漳县| 安龙县| 洛南县| 微博| 吕梁市| 马山县| 馆陶县|