大數據的核心價值到底是什么?
先說結論:大數據的終極核心價值在于“資源優化配置”。
無論是大數據在農業的使用也罷,工業的使用也罷,抑或是在金融行業的使用也罷,終究都是經過大數據技能來獲悉事情開展的本相,終究使用這個“本相”來愈加合理的配置資本。
具體來說,要實現大數據的核心價值,還需要前兩個重要的步驟,第一步是通過“眾包”的形式收集海量數據,第二步是通過大數據的技術途徑進行“全量數據挖掘”,最后利用分析結果進行“資源優化配置”。
只說概念大家肯定沒法直觀的理解上面的觀點,那就將幾個咱們都接觸過的例子講一講大數據是怎么通過這三步發揮核心價值的?
第一步、通過“眾包”產生和收集數據
高德地圖、百度地圖都有實時路況的功能,但大家有沒有想過實時路況的數據是怎么收集的?實際上經過了三個階段,開始是跟交通口的一些公司合作,獲取交通流量監測設備的數據,這個方法缺陷很明顯,一個是受制于人,一個是想擴大監測范圍就要部署大量設備,費時費力,而且還受法律制約。于是一些專門做路況的公司開始用出租車當浮動車收集數據。但這種辦法還是無法覆蓋大量的大小路段,隨著移動互聯網的普及,高德地圖的APP能夠實時上傳大量機動車的速度和位置信息,經過去噪和綜合分析,就形成了覆蓋率極高的實時路況信息。這就是一個典型的“眾包”過程。
嚴謹一點來說,眾包指的是一個公司或機構把過去由員工執行的工作任務,以自由自愿的形式外包給非特定的(而且通常是大型的)大眾網絡的做法。
大數據的“海量數據”就是由“眾包”產生的。廣義上,用戶的行為數據,各種傳感器的數據,也都是“眾包”的形式,只要是由過去集中式的產生模式擴散到分布式的模式,都是眾包的形式。
第二步、通過“全量數據挖掘”獲知“真相”
曾經看過一個視頻,通過分析阿里巴巴全年的數據得到的阿里巴巴的世界貿易與全國貿易的趨勢。視頻中體現的不僅是阿里巴巴集團的運營情況,其實也部分反映了整個中國的經濟運行情況。而且這些數據不是通過采樣得來的,就是真真切切的“全量數據”。我們再也不用通過“管中窺豹”的形式來推測全局,而是直接通過“上帝視角”來窺視真相。這就是大數據的魅力,我們獲得了前所未有的獲取真相的能力,而且對于大型互聯網公司來說,即使是PB級別的數據分析也是準實時的,我們下一個小時就能夠得知上一個小時的全量數據分析結果,這樣的能力是前所未有的。
第三步 大數據的核心價值——“資源優化配置”
前段時間,滴滴打車曾通過投票和訂單分析的方式得出了北上廣深四地的加班大樓排行榜,敝司不幸排名第三,但事實真的是即使加班很晚也很難打到車啊啊!所以滴滴打車更名為“滴滴出行”之后,也拋出了他們偉大的愿景,那就是利用大數據分析實時綜合調度“快車”、“專車”、“出租車”、“順風車”甚至是滴滴巴士的資源,實現全局的交通資源優化。事實也是如此,滴滴的司機們越來越多的需要完成“指派任務”,而不是集中去搶高凈值客戶。也許對于個別單體來說他們的利益降低了,但全局的資源配置卻避免了全局的資源浪費和過度競爭,無疑大大提高了交通資源的使用效率。
所以我們說,基于大數據分析的結果,進行資源優化配置,才是大數據應用的落地點和真正價值。
而“資源優化配置”的價值,又遠遠超出我們能夠想象的層面,在資本寒冬即將來臨的大背景下,利用大數據實現資源的高效利用,顯得更加重要。廣告行業利用DMP、DSP進行廣告的精準投放,房地產行業利用大數據分析價值洼地,宜信利用大數據建設征信系統降低壞賬率,券商陸續推出大數據基金,全部都是廣義的“資源優化配置”的體現。大數據也遠遠不再停留在學術和“分析現象”的階段,而是在各行各業實現了落地并發揮著非常非常重要的價值。
我是在互聯網廣告行業從事程序化購買系統建設的,而這個行業也是大數據最先發揮價值的地方。舉個最簡單的例子來說明大數據在廣告資源優化配置上的作用。寶潔集團是我們的客戶,而寶潔的產品有非常強的用戶性別傾向性,護舒寶的廣告就應該投給女性,投給男性就是赤裸裸的浪費。而吉列的目標用戶就只是男性。之前保潔集團是怎么做廣告的?就是海投品牌廣告,不分性別的海投,那這個做法在投放之前就已經確切無疑的知道有一半廣告費用時浪費的。但沒有辦法,因為我們沒有大數據技術來發掘用戶的性別。
而隨著DMP(Data Management Platform)技術的不斷成熟,越來越多的廣告主建立起自己的用戶數據中心,可以不斷積累客戶的各種用戶行為,進而判斷出用戶的性別,再通過DSP(Demand Side Platform)系統定向投放,最終可以為寶潔節省一半的廣告預算。
上面的例子正是廣告資源的優化配置,事實上DMP系統對用戶畫像的構建精確程度遠超人們的想象,精準投放的各類篩選條件也越來越精細?,F在微信支持精確到設備的精準投放,也就是未來完全可能實現精確到每個人終端的精準投放,這都依賴于大數據對于用戶行為的挖掘,最終實現整個廣告行業的效果提升。
很多同學可能會說大數據的核心是數據挖掘,是分布式存儲,是NLP,是深度學習,但這一切其實只是大數據的技術途徑,大數據的終極核心價值就在于“資源優化配置”。
馬哥學習交流群