你應該知道關于Python的這幾個技巧!
隨著大數據時代的到來,我們每天都在接觸爬蟲相關的事情,這其中就不得不提及Python這門編程語言。我已經使用Python編程有多年了,即使今天我仍然驚奇于這種語言所能讓代碼表現出的整潔和對DRY編程原則的適用。這些年來的經歷讓我學到了很多的小技巧和知識,大多數是通過閱讀很流行的開源軟件,如Django, Flask,Requests中獲得的。
1. 字典推導(Dictionary comprehensions)和集合推導(Set comprehensions)
大多數的Python程序員都知道且使用過列表推導(list comprehensions)。如果你對list comprehensions概念不是很熟悉——一個list comprehension就是一個更簡短、簡潔的創建一個list的方法。
>>>?some_list?=?[1,?2,?3,?4,?5]
>>>?another_list?=?[?x?+?1?for?x?in?some_list?]
>>>?another_list
[2,?3,?4,?5,?6]
自從python 3.1 (甚至是Python 2.7)起,我們可以用同樣的語法來創建集合和字典表:
>>>?#?Set?Comprehensions
>>>?some_list?=?[1,?2,?3,?4,?5,?2,?5,?1,?4,?8]
>>>?even_set?=?{?x?for?x?in?some_list?if?x?%?2?==?0?}
>>>?even_set
set([8,?2,?4])
>>>?#?Dict?Comprehensions
>>>?d?=?{?x:?x?%?2?==?0?for?x?in?range(1,?11)?}
>>>?d
{1:?False,?2:?True,?3:?False,?4:?True,?5:?False,?6:?True,?7:?False,?8:?True,?9:?False,?10:?True}
在第一個例子里,我們以some_list為基礎,創建了一個具有不重復元素的集合,而且集合里只包含偶數。而在字典表的例子里,我們創建了一個key是不重復的1到10之間的整數,value是布爾型,用來指示key是否是偶數。
這里另外一個值得注意的事情是集合的字面量表示法。我們可以簡單的用這種方法創建一個集合:
>>>?my_set?=?{1,?2,?1,?2,?3,?4}
>>>?my_set
set([1,?2,?3,?4])
而不需要使用內置函數set()。
2. 計數時使用Counter計數對象
這聽起來顯而易見,但經常被人忘記。對于大多數程序員來說,數一個東西是一項很常見的任務,而且在大多數情況下并不是很有挑戰性的事情——這里有幾種方法能更簡單的完成這種任務。
Python的collections類庫里有個內置的dict類的子類,是專門來干這種事情的:
>>>?from?collections?import?Counter
>>>?c?=?Counter('hello?world')
>>>?c
Counter({'l':?3,?'o':?2,?'?':?1,?'e':?1,?'d':?1,?'h':?1,?'r':?1,?'w':?1})
>>>?c.most_common(2)
[('l',?3),?('o',?2)]
3. 漂亮的打印出JSON
JSON是一種非常好的數據序列化的形式,被如今的各種API和web service大量的使用。使用python內置的json處理,可以使JSON串具有一定的可讀性,但當遇到大型數據時,它表現成一個很長的、連續的一行時,人的肉眼就很難觀看了。
為了能讓JSON數據表現的更友好,我們可以使用indent參數來輸出漂亮的JSON。當在控制臺交互式編程或做日志時,這尤其有用:
>>>?import?json
>>>?print(json.dumps(data))?#?No?indention
{"status":?"OK",?"count":?2,?"results":?[{"age":?27,?"name":?"Oz",?"lactose_intolerant":?true},?{"age":?29,?"name":?"Joe",?"lactose_intolerant":?false}]}
>>>?print(json.dumps(data,?indent=2))?#?With?indention
{
?"status":?"OK",
?"count":?2,
?"results":?[
?{
?"age":?27,
?"name":?"Oz",
?"lactose_intolerant":?true
?},
?{
?"age":?29,
?"name":?"Joe",
?"lactose_intolerant":?false
?}
?]
}
同樣,使用內置的print模塊,也可以讓其它任何東西打印輸出的更漂亮。
4. 創建一次性的、快速的小型web服務
有時候,我們需要在兩臺機器或服務之間做一些簡便的、很基礎的RPC之類的交互。我們希望用一種簡單的方式使用B程序調用A程序里的一個方法——有時是在另一臺機器上。僅內部使用。
我并不鼓勵將這里介紹的方法用在非內部的、一次性的編程中。我們可以使用一種叫做XML-RPC的協議 (相對應的是這個Python庫),來做這種事情。
下面是一個使用SimpleXMLRPCServer模塊建立一個快速的小的文件讀取服務器的例子:
from?SimpleXMLRPCServer?import?SimpleXMLRPCServer
def?file_reader(file_name):
?with?open(file_name,?'r')?as?f:
?return?f.read()
server?=?SimpleXMLRPCServer(('localhost',?8000))
server.register_introspection_functions()
server.register_function(file_reader)
server.serve_forever()
客戶端:
import?xmlrpclib
proxy?=?xmlrpclib.ServerProxy('http://localhost:8000/')
proxy.file_reader('/tmp/secret.txt')
我們這樣就得到了一個遠程文件讀取工具,沒有外部的依賴,只有幾句代碼(當然,沒有任何安全措施,所以只可以在家里這樣做)。
5. Python神奇的開源社區
這里我提到的幾個東西都是Python標準庫里的,如果你安裝了Python,你就已經可以這樣使用了。而對于很多其它類型的任務,這里有大量的社區維護的第三方庫可供你使用。
好啦!今天的分享到這里就結束了!希望大家持續關注馬哥教育官網,每天都會有大量優質內容與大家分享。聲明:文章轉載于網絡,版權歸原作者所有,如有侵權請及時聯系刪除!