(點選上方公眾號,可快速關註一起學Python)
來源: Python空間 連結:
https://mp.weixin.qq.com/s/mDh15ML7YyONc62sYSD3tw
寫在之前
Python 的高階語言特性一直是我們學習 Python 的一個難點,大部分人並沒有做到熟練的掌握,甚至去學習它都感覺很困難,「生成器」作為其中甚是有用的特性之一,更是如此。
因為在其它的主流語言(C/C++/JAVA)中並沒有生成器的概念,加之其具有一定的難度,學習起來花費的時間成本較大,很多人自我安慰式的視其為“雞肋”,然後果斷放棄如此有用的一個高階語言特性,實在是一件很惋惜的事情。
其實不光是對於「生成器」而言,對於其它的高階語言特性還是建議大家要花點時間去搞懂的,不說其它,這些東西作為面試中常考的內容也應該引起你的重視,畢竟公司不是傻瓜,沒有用的東西幹嘛要考你?
接下來就讓我們來一起學習「生成器」,我儘量用大家都聽的懂的話,層層遞進的講解,保證大家都能看懂,前提是要有耐心,文章較長,建議先收藏再看。
答應我,一定要有耐心。
迭代器
在這說「迭代器」的原因是「生成器」自動實現了「迭代器協議」,所謂協議,就是一種約定。為了更好的理解生成器,我們需要簡單知道一下「迭代器協議」到底是個什麼東西。其實只需要滿足兩個兩個條件:1.實現 __iter__ 方法;2.物件實現 next() 方法,要麼傳回迭代中的下一項,要麼就是以 StopIteration 異常終止迭代。
物件就是「可迭代物件」,即實現了迭代器協議的物件,它實現了迭代器協議。其實像是 Python 中 for 迴圈,sum 函式等等就是使用迭代器協議訪問物件。
生成器
如果你理解了上一節的內容,那麼恭喜你,接下來學習「生成器」就會簡單很多。Python 使用生成器對「延遲操作」提供了支援,所謂「延遲操作」就是在需要它的時候才產生結果,而不是說立即產生結果。
Python 其實有兩種不同的方法來提供生成器,一種是函式形式,另一種是運算式形式,說全一點兒就是「生成器函式」和「生成器運算式」。
1.生成器函式
「生成器函式」和普通的函式定義類似。區別在於普通函式使用 return 傳回結果,生成器函式是用 yield 傳回結果。
yield 的作用是在呼叫的時候傳回相應的值,一次傳回一個結果,在每個結果中間掛起函式的狀態(即暫停執行),下一次執行是從上次暫停的位置開始,繼續向下執行。
下麵我們來做一道題,要求寫出「將一個全是整數的串列進行操作後只保留奇數」。相信大多數人都能很快的寫出下麵這樣的函式:
def get_odd(lst):
res = []
for i in lst:
if i % 2:
res.append(i)
return res
def main():
lst = range(10)
for i in get_odd(lst):
print(i)
if __name__ == '__main__':
main()
上面這個沒什麼難度,既然我們學了「生成器」,我在前面還這麼舔它,是不是我們該用生成器來做一下這道題?看看用生成器來做同樣的功能,到底有什麼不同:
def get_odd(lst):
for i in lst:
if i % 2:
yield i
def main():
lst = range(10)
for i in get_odd(lst):
print(i)
if __name__ == '__main__':
main()
對比一下這個功能的兩種做法,使用「生成器」以後,程式碼變的行數更少了(省去了對 res 的操作,不用把結果存在 res 裡),程式碼整體看起來更清晰了(一看就知道幹嘛的,不用一上來去想 res 是個什麼鬼,append 進去的是個什麼玩意兒)。
2.生成器運算式
「生成器運算式」和串列推導式類似。區別在於使用串列推導,一次會產生所有的結果,而用「生成器運算式」則不會這樣,它是按需產生。
串列推導式的寫法如下:
>>> res = [x for x in range(5)]
>>> res
[0, 1, 2, 3, 4]
生成器運算式就是將上面的 [] 變成 () 即可:
>>> res = (x for x in range(5))
>>> res
at 0x109d9f570>
>>> next(res)
0
>>> next(res)
1
>>> next(res)
2
>>> next(res)
3
我們也順便簡單的看一下「生成器」的優勢在「生成器運算式」中是怎麼體現的。如果我們想對一系列整數求和,直接用生成器可以寫成下麵這樣:
>>> sum((x for x in range(5)))
10
當然為了方便起見,也可以省略圓括號,即寫成下麵這樣:
>>> sum(x for x in range(5))
10
但是如果你用常規的寫法去寫,就會寫成下麵這樣:
>>> sum([x for x in range(5)])
10
上面的程式碼先構造了一個串列,然後再用 sum 函式求和,多了一步,天差地別,光在時間效率上,就已經輸掉了褲子。
所以綜合上面文章所講,「生成器」光在明面上的優點就有好幾個:程式碼行數更少;程式碼更易讀;時效更高…
所以,你還敢視它為“雞肋”嗎?
(完)
看完本文有收穫?請轉發分享給更多人
關註「Python那些事」,做全棧開發工程師