Python 的異步 IO:Asyncio 簡介
Python 的 asyncio 類似于 C++ 的 Boost.Asio。
異步 IO,就是你發起一個 IO 操作,不用等它結束,可以繼續做其他事情,當它結束時,你會得到通知。
Asyncio 是并發(concurrency)的一種方式。對 Python 來說,并發還可以通過線程(threading)和多進程(multiprocessing)來實現。
Asyncio 并不能帶來真正的并行(parallelism)。當然,因為 GIL(全局解釋器鎖)的存在,Python 的多線程也不能帶來真正的并行。
可交給 asyncio 執行的任務,稱為協程(coroutine)。一個協程可以放棄執行,把機會讓給其它協程(即 yield from 或 await)。
定義協程
協程的定義,需要使用 async def 語句。
do_some_work 便是一個協程。
準確來說,do_some_work 是一個協程函數,可以通過 asyncio.iscoroutinefunction 來驗證:
這個協程什么都沒做,我們讓它睡眠幾秒,以模擬實際的工作量 :
在解釋 await 之前,有必要說明一下協程可以做哪些事。協程可以:
asyncio.sleep 也是一個協程,所以 await asyncio.sleep(x) 就是等待另一個協程。可參見 asyncio.sleep 的文檔:
運行協程
調用協程函數,協程并不會開始運行,只是返回一個協程對象,可以通過 asyncio.iscoroutine 來驗證:
此處還會引發一條警告:
要讓這個協程對象運行的話,有兩種方式:
簡單來說,只有 loop 運行了,協程才可能運行。
下面先拿到當前線程缺省的 loop ,然后把協程對象交給 loop.run_until_complete,協程對象隨后會在 loop 里得到運行。
run_until_complete 是一個阻塞(blocking)調用,直到協程運行結束,它才返回。這一點從函數名不難看出。
run_until_complete 的參數是一個 future,但是我們這里傳給它的卻是協程對象,之所以能這樣,是因為它在內部做了檢查,通過 ensure_future 函數把協程對象包裝(wrap)成了 future。所以,我們可以寫得更明顯一些:
完整代碼:
運行結果:
回調
假如協程是一個 IO 的讀操作,等它讀完數據后,我們希望得到通知,以便下一步數據的處理。這一需求可以通過往 future 添加回調來實現。
多個協程
實際項目中,往往有多個協程,同時在一個 loop 里運行。為了把多個協程交給 loop,需要借助 asyncio.gather 函數。
或者先把協程存在列表里:
運行結果:
這兩個協程是并發運行的,所以等待的時間不是 1 + 3 = 4 秒,而是以耗時較長的那個協程為準。
參考函數 gather 的文檔:
發現也可以傳 futures 給它:
gather 起聚合的作用,把多個 futures 包裝成單個 future,因為 loop.run_until_complete 只接受單個 future。
run_until_complete 和 run_forever
我們一直通過 run_until_complete 來運行 loop ,等到 future 完成,run_until_complete 也就返回了。
輸出:
現在改用 run_forever:
輸出:
三秒鐘過后,future 結束,但是程序并不會退出。run_forever 會一直運行,直到 stop 被調用,但是你不能像下面這樣調 stop:
run_forever 不返回,stop 永遠也不會被調用。所以,只能在協程中調 stop:
這樣并非沒有問題,假如有多個協程在 loop 里運行:
第二個協程沒結束,loop 就停止了——被先結束的那個協程給停掉的。
要解決這個問題,可以用 gather 把多個協程合并成一個 future,并添加回調,然后在回調里再去停止 loop。
其實這基本上就是 run_until_complete 的實現了,run_until_complete 在內部也是調用 run_forever。
Close Loop?
以上示例都沒有調用 loop.close,好像也沒有什么問題。所以到底要不要調 loop.close 呢?
簡單來說,loop 只要不關閉,就還可以再運行。:
但是如果關閉了,就不能再運行了:
建議調用 loop.close,以徹底清理 loop 對象防止誤用。
gather vs. wait
asyncio.gather 和 asyncio.wait 功能相似。
具體差別可請參見 StackOverflow 的討論:Asyncio.gather vs asyncio.wait。
Timer
C++ Boost.Asio 提供了 IO 對象 timer,但是 Python 并沒有原生支持 timer,不過可以用 asyncio.sleep 模擬。