久久国产乱子伦精品免费M,亚洲一区二区三区91,欧美国产在线视频,国产精品视频久久

Python 處理 JSON 我選擇 ujson 和 orjson

在 Python 使用用??json.dumps(data)?時突然發(fā)現(xiàn)特別慢,data?本身不大,但是一個包含很多元素的列表,所以促使本人尋找一個替代的 JSON 處理庫。大概對比了一個 ujson(UtltraJSON), python-rapidjson(RapidJSON) 和 Python 自帶的 json 庫。還有一個 simplejson 是為兼容 Python 2.6 以前用的(json 是 Python 2.6 新加入的 API),性能有些差。
基本上姜還是老的辣,想要收獲更好的性能,還得仰賴傳統(tǒng)的 C/C++ 語言,ujson 是用純 C 寫的,RapidJSON 是 C++ 寫的,后者還是十美分的開源產(chǎn)品。json, ujson, rapidjson 三者?loads()?方法的性能差別不太明顯,但?dumps()?大對象時 Python 自帶的 json 庫就要考驗用戶的耐心了。
注:最開始本來認定了 ujson 為最佳選擇, 所以先從 usjon 和 rapidjson 切入的,后來寫作本文的過程中,從 usjon 的自我介紹中發(fā)現(xiàn)了 Rust 寫的 orjson 很顯眼,才加入了 orjson 的測試,看來 orjson 更值得擁有。
以上三個 json?組件的安裝方式分別為
pipinstallujson
pip install python-rapidjson
$ pip install simplejson
自己測試了一個 ujson 和 rapidjson 與 Python json 庫的?dumps()?的性能,simpejson 不太考慮了。測試代碼如下
Python 處理 JSON 我選擇 ujson 和 orjson
執(zhí)行?python 1000|10000|100000|1000000 json|ujson|rapidjson, 試結(jié)果統(tǒng)計如下(數(shù)字為不同情況下的耗時):
Python 處理 JSON 我選擇 ujson 和 orjson
基本上測試的性能和 Benchmark of Python JSON libraries 中的是一致的。從原文中截取了兩張圖如下:
Python 處理 JSON 我選擇 ujson 和 orjson
Python 處理 JSON 我選擇 ujson 和 orjson

在 UltraJSON 的 Github 項目頁面中也有對比 ujson, nujson, orjson, simplejson, json 的 Benchmarks。其中列出的 orjson(pip install orjson) 和 nujson(pip install nujson, Fork 了 UltraJSON 來支持 Numpy 序列化的) 性能表現(xiàn)上不錯,orjson 表現(xiàn)上比 ujson 還更為卓越。

看到了?orjson?后,趕緊做個對比測試,在上面的 test.py?代碼中再加上

Python 處理 JSON 我選擇 ujson 和 orjson

再列出完整的對比數(shù)據(jù)

Python 處理 JSON 我選擇 ujson 和 orjson

繼續(xù)翻看 orjson 的 Github 主頁面 ijl/orjson, 它既非用 C 也不是用 C++ 寫的,而是 Rust 語言,真是讓我眼前一亮,Rust 程序運行速度真的能與 C/C++?相媲美的。寫到這里我要開始改變當(dāng)初只認 ujson 的主意了,orjson 或許是更佳的選擇, 本文的標題也由最初擬定的 “Python 處理 JSON 必要時我選擇 ujson(UltraJSON)” 變成了 “Python 處理 JSON 必要時我選擇 ujson 和 orjson”。這也是寫博客時,盡可能收集更多的素材多的魅力。

補充一下,orjson 的 dumps() 函數(shù)使用略有不同,不再用?indent?參數(shù),并且返回值是 bytes,所以格式化成字符串的寫法如下

Python 處理 JSON 我選擇 ujson 和 orjson

另外,在使用 ujson 時碰到的一個 bug 也順便記錄在此,就不立新篇了,反正現(xiàn)在找東西都不太看標題,而是 Google 到其中的內(nèi)容。ujson 3.0.0 和 3.1.0 版本的?dumps()?的 indent 參數(shù)工作不正常,有個未關(guān)閉的 ticket?'indent' parameter for?dumps?doesn't indent properly in 3.0.0 #415。比如使用 ujson 3.1.0?時的現(xiàn)像是

Python 處理 JSON 我選擇 ujson 和 orjson

indent 大于 1 時都當(dāng)作 1。

換回到 ujson 2.0.3 版本時沒問題

Python 處理 JSON 我選擇 ujson 和 orjson

在這個問題未解決之前就暫時用?pip install ujson==2.0.3?安裝 ujson 2.0.3 吧,但是這個版本無法序列化?datetime?類型。

原文鏈接:https://yanbin.blog/python-json-choose-ujson-if-necessary/

文章轉(zhuǎn)載:Python編程學(xué)習(xí)圈
(版權(quán)歸原作者所有,侵刪)

相關(guān)新聞

歷經(jīng)多年發(fā)展,已成為國內(nèi)好評如潮的Linux云計算運維、SRE、Devops、網(wǎng)絡(luò)安全、云原生、Go、Python開發(fā)專業(yè)人才培訓(xùn)機構(gòu)!

    1. 主站蜘蛛池模板: 博白县| 民乐县| 永善县| 昌平区| 柳江县| 芜湖县| 曲沃县| 汽车| 宁化县| 万盛区| 新津县| 绵阳市| 镇远县| 瑞昌市| 泽州县| 雅江县| 河南省| 阿拉尔市| 南充市| 平谷区| 诸城市| 西充县| 同心县| 宁德市| 云浮市| 新绛县| 涡阳县| 雅安市| 乃东县| 筠连县| 九江县| 方正县| 高雄市| 吉首市| 温州市| 行唐县| 日照市| 城口县| 永济市| 阳信县| 民权县|