各行各業中數據科學的區別
品覺導讀:
- 只要信息技術職業的數據科學家才以開發人員為主,但更重視數據剖析而不是技術立異的職業(比方教學/科學和醫療保健)則以研究人員為主,而著重經過立異思想解決問題的職業(比方專業效勞和通訊)則以創意人士為主。
- 滿意度高的行業(教育/科學:77%的人擁有高級學位)比滿意度低的行業(廣告/媒體/娛樂:71%的人擁有高級學位)擁有更多的高學歷數據科學家。
- 雖然數據科學家從事于各行各業,但他們中的很多人都來自少數幾個行業。行業不同,其數據科學家的類型也不同。雖然每個行業都涵蓋了數據科學家的所有四個類型,但側重點各有不同。
原文翻譯:
一份名為《AnalyticsWeek和BusinessOver Broadway數據科學調查》的報告揭示了數據科學所扮演的角色、數據科學技能的熟練度以及項目結果滿意度在各行各業的差異。信息技術行業擁有最多的數據科學家。在雇傭數據科學家最多的十大行業中,有六個行業的研究型數據科學家數量超過了其他類型的數據科學家。與其他行業的數據科學家相比,專業服務行業的數據科學家在數據科學的三大技能——商業、技術和數學/統計方面,都擁有非常高的熟練度。
各行業的數據科學家占比
圖1:各行業的數據科學家占比
在我們對數據科學家的調查中,我們詢問了1000多位數據科學家的個人和工作情況、他們對三項數據科學技能(商業、技術及數學/統計)的熟練程度、他們所扮演的角色(企業管理、開發人員、創意人士和研究人員)以及他們對所從事項目結果的滿意度。
調查顯示(圖1),雇傭數據科學家最多的行業依次是信息技術(26%)、教育/科學(14%)、咨詢(13%)、金融服務(11%)和醫療保健(9%)。
數據科學在各行業所扮演的角色
圖2:數據科學在各行業所扮演的不同角色
接下來,我們看看數據科學家在其公司里扮演的不同角色。由于樣本容量的限制,我們只列出了十個行業的調查結果(另外14個行業的樣本容量低于20)。
圖2顯示,以研究人員為主的行業包括教育/科學(83%)、廣告/媒體/娛樂(69%)、金融服務(65%)、醫療保健(61%)、咨詢(61%)和政府(59%)。不出所料,開發人員是信息技術行業(57%)里最常見的數據科學家類型。企業管理人員則是零售/消費產品行業(69%)里最常見的數據科學家類型。此外,創意人士是專業服務(58%)和通信(57%)行業里最常見的數據科學家類型。
各行業的數據科學技能熟練度
圖3:各行業的數據科學技能熟練度差異
下面,看看各行業的數據科學技能熟練度(圖3)。總體來看,各行業的技能熟練度特點趨于一致。在十個行業中,有九個行業的數據科學家在商業和數學/統計技能方面的熟練度超過了技術方面(教育/科學行業除外)。
另外,三項數據科學技能的熟練度在不同行業中存在顯著的統計學差異。與其他行業相比,專業服務行業的數據科學家在所有三項數據科學技能方面,都擁有最高的熟練度。
教育/科學行業的數據科學家擁有最高的數學/統計技能熟練度(64),但商業技能的熟練度最低(44)。
教育/科學和醫療保健行業的數據科學家擁有最低的技術技能熟練度。
各行業的數據分析項目結果滿意度
圖4:各行業的數據分析項目結果滿意度
對數據分析項目結果的滿意度存在顯著的統計學差異(圖4)。教育/科學、咨詢和金融服務行業的數據科學家對項目結果的滿意度最高,而政府、廣告/媒體/娛樂和通信行業的數據科學家則對項目結果的滿意度最低。
總結
調查結果顯示,行業之間在以下三個方面存在差異:1. 數據科學家的工作角色;2.數據科學家對數據科學技能的熟練度;3. 對項目結果的滿意度。
調查顯示,近75%的數據科學家來自五個行業:信息技術(26%),教育/科學(14%)、咨詢(13%)、金融服務(11%)和醫療保健(9%)。此外,不同行業在數據科學家類型、技能熟練度以及項目結果滿意度方面,也存在差異。
數據科學在各行業所扮演的角色大為不同。在十個行業中,有六個行業的數據科學家以研究人員為主。在其余行業中,則以另外三個角色為主。這種差異反映了各個行業所需要數據科學家完成的工作量和工作類型的不同。例如,只有信息技術行業的數據科學家才以開發人員為主,但更注重數據分析而不是技術創新的行業(比如教育/科學和醫療保健)則以研究人員為主,而強調通過創新思維解決問題的行業(比如專業服務和通信)則以創意人士為主。
各行業在數據科學家的技能熟練度方面也存在差異。只有教育/科學和專業服務兩個行業的數據科學家掌握足夠的數學/統計技能熟練度(熟練度不低于60)。而另一方面,只有通信行業的數據科學家擁有足夠的商業技能熟練度。
最后,各行業在數據分析項目結果的滿意度方面同樣存在差異。為了弄清造成這種差異的原因,我們分析了每個行業的數據科學家類型及其教育水平。先前的調查發現,這兩個因素與項目結果的滿意度有關:研究人員對項目結果的滿意度明顯高于開發人員和企業管理人員。目前這次調查顯示,滿意度最高的四個行業是那些至少半數受訪者為研究人員的行業。然而,在滿意度最低的三個行業中,有兩個行業也是研究人員占比較高的行業。
接下來看看教育水平。我們之前發現,與學歷較低(高中、專科和本科)的數據科學家相比,獲得高級學位(碩士和博士)的數據科學家在很多技能方面都擁有更高的熟練度。然而,我們在分析各行業數據科學家的教育水平時,沒有明確的跡象表明,滿意度高的行業(教育/科學:77%的人擁有高級學位)比滿意度低的行業(廣告/媒體/娛樂:71%的人擁有高級學位)擁有更多的高學歷數據科學家。我們需要進一步的研究才能更好地理解,究竟是什么導致各行業在項目結果的滿意度方面存在上述差異。
盡管數據科學家從事于各行各業,但他們中的很多人都來自少量幾個職業。職業不一樣,其數據科學家的類型也不一樣。盡管每個職業都涵蓋了數據科學家的一切四個類型,但側重點各有不一樣。查詢結果表明,不管身處哪一職業,數據科學家的責任在于優化數據科學的價值。非常好地輿解數據科學方法、實習和結果的職業性差異,有助于公司對于各自職業特色挑選最合適的數據科學家,也有助于招聘人員找到最合適的數據科學家。