99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

哪些才是對數(shù)據(jù)科學家最迫切的技能呢?

jmiy_worldofai ? 來源:未知 ? 作者:李倩 ? 2018-11-19 18:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)是新的石油,不過要想開采石油需要有熟練的工程師才行。數(shù)據(jù)科學家就是干這個的。但是要想成為一名數(shù)據(jù)科學家,你得掌握特定技能才行。哪些才是對數(shù)據(jù)科學家最迫切的技能呢?讓Jeff Hale告訴我們答案。最難能可貴的是,其對需求最迫切技能的研究分析也體現(xiàn)出了一位數(shù)據(jù)科學家的素養(yǎng)。這個分析過程本身就非常的嚴謹,值得學習借鑒。

大家對數(shù)據(jù)科學家的預期是應該懂很多——機器學習、計算機科學、統(tǒng)計、數(shù)學、數(shù)據(jù)可視化、溝通,以及深度學習。這些領域牽涉到很多的語言、框架以及技術的學習。數(shù)據(jù)科學家要想成為雇主想要的那種人才的話,應該把學習的精力放在哪些地方呢?

我到求職網(wǎng)站去尋找對數(shù)據(jù)科學家最迫切的技能需求是什么。我看了一般的數(shù)據(jù)科學技能,也分別看了對語言和工具的要求。2018年10月10日,我在LinkedIn、Indeed、SimplyHired、Monster以及AngelList上面搜索了求職列表。下面這張圖列出了每個網(wǎng)站對數(shù)據(jù)科學家的需求數(shù)量。

我看了很多求職列表和調(diào)查以找出最常見的技能。像管理這類的術語就不進行比較了,因為可以用到的場合太多了。

所有的搜索都是針對美國,使用了“data scientist(數(shù)據(jù)科學家)”、“[keyword]”作為搜索關鍵字。采用精確匹配以減少搜索結果數(shù)。然而,這個方法確保了結果對數(shù)據(jù)科學家職位是相關的,并且對所有搜索術語都產(chǎn)生類似的作用。

AngelList提供的是列出數(shù)據(jù)科學家崗位的公司數(shù)而不是崗位數(shù)。我把AngelList從所有分析里面排除掉了,因為其搜索算法似乎按照OR型的邏輯搜索進行,沒有辦法改成AND。如果你尋找的是“數(shù)據(jù)科學家”“TensorFlow”的話,AngelList也沒問題,因為這只能在數(shù)據(jù)科學家崗位里面找到,但如果你的關鍵字是“數(shù)據(jù)科學家”“react.js”的話,它返回的結果就太多了,其中會包括一大堆非數(shù)據(jù)科學家的崗位列表。

Glassdoor也被排除在我的分析之外。該網(wǎng)站聲稱在美國有26263個“數(shù)據(jù)科學家”職位,但是顯示出來的卻不超過900個。此外,它上面的數(shù)據(jù)科學家崗位數(shù)超過任何其他主流平臺3倍以上似乎極不可能。

LinkedIn上超過400個崗位列表都提到的通用技能以及超過200個崗位列表都提到的特別技術被納入到最終分析里面。當然,這兩者之間會有一些交叉。結果已經(jīng)被記錄進這張Google Sheet里面。

我下載了.csv文件并且導入到JupyterLab。然后我計算了出現(xiàn)比例并求出求職網(wǎng)站之間的平均數(shù)。

我還將軟件結果跟GlassDoor的一項研究(2017年上半年,針對數(shù)據(jù)科學家崗位列表)進行了對比。再結合KDNuggets使用情況調(diào)查的信息,似乎一些技能正在變得越來月重要,而其他一些的相關性則在下降。后面我們會細談。

互動式圖表可以到我的Kaggle Kernel上面去看,額外分析可參見此處。可視化我用的是Plotly。為了本文結合使用Plotly和JupyterLab可費了一點功夫——相關指令可到我的Kaggle Kernel找,另外這里也有Plotly的腳本。

通用技能

下面這張圖反映的是雇主尋找最頻繁的數(shù)據(jù)科學家通用技能。

結果表明,分析和機器學習是數(shù)據(jù)科學家崗位的核心技能。從數(shù)據(jù)中發(fā)現(xiàn)洞察是數(shù)據(jù)科學的主要職能。機器學習則是要創(chuàng)建系統(tǒng)來預測表現(xiàn),這是非常亟需的技能。

數(shù)據(jù)科學需要統(tǒng)計和計算機科學技能——這一點并不出奇。統(tǒng)計分析、計算機科學以及數(shù)學也是大學的專業(yè),這大概對其出現(xiàn)頻率有幫助。

有趣的是溝通在將近一般的崗位列表中被提到。數(shù)據(jù)科學家需要將洞察與工作與他人進行溝通。

AI和深度學習的出現(xiàn)頻率沒有其他一些屬于那么頻繁。然而,它們都屬于機器學習的子集。機器學習過去由其他算法執(zhí)行的任務正在被越來越多的深度學習算法替代。比方說,大多數(shù)自然語言處理問題最好的機器學習算法現(xiàn)在都是深度學習算法。我預計深度學習技能在未來的需求會更加迫切,而機器學習也將日益變成深度學習的同義詞。

此外,哪些數(shù)據(jù)科學家的軟件工具是雇主想要尋求的呢?下面我們就來看看這個問題的答案。

技術技能

以下是雇主希望數(shù)據(jù)科學家掌握的排名靠前的20種語言、庫以及技術工具。

我們大概看一下其中最常見的技術技能。

Python

Python是需求最旺盛的語言。這門開源語言的流行度已經(jīng)被很多人注意到。它對初學者很友好,有許多支持資源。絕大部分新的數(shù)據(jù)科學工具都兼容它。Python是數(shù)據(jù)科學家的主要語言。

R

R語言并不比Python落后多少。它一度是數(shù)據(jù)科學的主要語言。我反而對它的需求依然如此旺盛感到吃驚。這門開源語言的根在統(tǒng)計,至今在統(tǒng)計學家那里仍非常流行。

Python或者R幾乎是每一個數(shù)據(jù)科學家崗位的必須。

SQL

SQL的需求也很高。SQL即結構化查詢語言(Structured Query Language),是與關系式數(shù)據(jù)庫的主要交互方式。SQL有時候會被數(shù)據(jù)科學界忽視,但這是一門值得掌握的技能,如果你打算切入求職市場的話。

Hadoop、Spark

接下來是Hadoop和Spark,這兩個都是出自Apache的大數(shù)據(jù)開源工具。

Apache Hadoop是一個利用商品化硬件搭建的計算機集群對超大規(guī)模數(shù)據(jù)集進行分布式存儲和分布式處理的開源軟件平臺。

Apache Spark是一個有著優(yōu)雅的、富有表現(xiàn)力的API,可讓數(shù)據(jù)工作者高效執(zhí)行需要對數(shù)據(jù)集進行快速迭代存取的流處理、機器學習或者SQL負載的快速內(nèi)存數(shù)據(jù)處理引擎。

相對于其他,這些工具在Medium和教程中被提及的次數(shù)少了點。我猜具備這些技能的求職者要比具備Python、R和SQL技能的求職者少得多。如果你掌握了一定Hadoop和Spark經(jīng)驗的話,應該可以在競爭中獲得優(yōu)勢。

Java、SAS

然后是Java和SAS。這兩門語言地位這么高倒是出乎我的意料。其背后都有大公司的支持,支持至少都提供了一些免費的產(chǎn)品。不過Java和SAS在數(shù)據(jù)科學社區(qū)受到的關注都很少。

Tableau

對Tableau的需求次之。這個分析平臺和可視化工具非常強大,易用,而且越來越流行。它有一個免費的公共版本,但是如果你想數(shù)據(jù)保持私有的話得花錢。

如果你對Tableau不熟悉的話,到Udemy上一門Tableau 10 A-Z快速了解一下絕對是值得的。聲明一下啊,我這么建議可不是拿了傭金的——那是因為我上過這門課之后發(fā)現(xiàn)它的確有用。

下面這張表反映的是更大范圍內(nèi)的語言、框架等數(shù)據(jù)科學軟件工具的需求情況。

歷史對比

GlassDoor對2017年1月到7月間數(shù)據(jù)科學家10大最常見的軟件技能進行了分析。以下是那些術語出現(xiàn)的頻度相對2018年10月在LinkedIn、Indeed、SimplyHired及Monster上出現(xiàn)頻度平均數(shù)的對比。

結果相當類似。我的分析和GlassDoor的分析都發(fā)現(xiàn)Python、R及SQL都是需求最旺盛的技能。兩份分析發(fā)現(xiàn)的需求前9大技術技能都是一樣的,盡管順序方面略有不同。

結果表明,相對于2017年上半年,R、Hadoop、Java、SAS及MatLab現(xiàn)在的需求略微下降,而對Tableau的需求則在上升。加上KDnuggets開發(fā)者調(diào)查這類的輔助性結果,我想這就是我預期的結論。R、Hadoop、Java和SAS均呈現(xiàn)出多年的下降趨勢,而則顯示出明顯的上升勢頭。

建議

基于這些分析的結果,以下是對當前和想要成為數(shù)據(jù)科學家的人提供的提升自我價值的建議。

證明你可以進行數(shù)據(jù)分析并且專注機器學習,要變得非常擅長。

對你的溝通技能進行投資。我建議去讀讀《Made to Stick(讓創(chuàng)意更有粘性)》這本書來讓你的想法產(chǎn)生更大影響。此外還可以用Hemmingway Editor這款app改進寫作的清晰性。

掌握一種深度學習框架。精通一種深度學習框架在精通機器學習中占據(jù)了越來越大的部分。深度學習框架在使用情況、流行度等方面的對比情況可以看我的這篇文章。

如果你要走學習Python和R語言之間做選擇的話,選Python。如果你對Python不感冒,那就選擇R。如果你也懂R的話在市場上一定會更加搶手。

當雇主尋找懂Python技能的數(shù)據(jù)科學家時,他們可能也會預期應征者了解常見的python數(shù)據(jù)庫庫:numpy、pandas、scikit-learn以及matplotlib等。如果你想學習這里提到的工具的話,我建議你看看以下這些資源:

DataCamp及DataQuest——均為定價合理的在線SaaS數(shù)據(jù)科學教育產(chǎn)品,可以一邊編碼一邊學習。這兩個都教若干的技術工具。

Data School上面有各種資源,其中就包括了一套很好的YouTube視頻,里面解釋了數(shù)據(jù)科學的概念。

McKinney的《Python for Data Analysis》。這本書是pandas庫的主要作者寫的,聚焦的是pandas,同時也討論了python基礎、numpy以及scikit-learn的數(shù)據(jù)科學功能。

Müller & Guido的《Introduction to Machine Leaning with Python》。Müller是scikit-learn的主要維護者之一。這本書非常優(yōu)秀,是學習用scikit-learn做機器學習的好讀物。

如果你尋求去學習深度學習的話,我建議先從Keras或者FastAI開始,然后再轉到TensorFlow或者PyTorch。Chollet的《Deep Learning with Python》是學習Keras的好資源。

除了這些推薦以外,我還建議你學習自己感興趣的東西,盡管在決定如何分配學習時間方面顯然有很多考慮因素。

LinkedIn

如果你要通過在線門戶找數(shù)據(jù)科學家崗位的話,我建議你從LinkedIn開始——這個地方總是有最多的結果。

如果你在求職網(wǎng)站上尋找工作或者職位的話,關鍵字很重要。每個網(wǎng)站搜“數(shù)據(jù)科學”返回的結果數(shù)幾乎是“數(shù)據(jù)科學家”的3倍。但如果你要找的就是數(shù)據(jù)科學家的工作的話,最好還是搜索“數(shù)據(jù)科學家”。

無論你去哪里找,我建議你要制作一份在線作品集來證明你擅長許多亟需的技能。我也建議你在LinkedIn檔案上展示你的技能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8502

    瀏覽量

    134589
  • 深度學習
    +關注

    關注

    73

    文章

    5561

    瀏覽量

    122792
  • 數(shù)據(jù)科學

    關注

    0

    文章

    168

    瀏覽量

    10485

原文標題:想從事數(shù)據(jù)行業(yè)?你必須掌握這個最核心的技能

文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    地物光譜儀如何幫助科學家研究植被和土壤?

    在遙感、生態(tài)、農(nóng)業(yè)等研究領域,科學家們常常會提到一個工具: 地物光譜儀 。它看起來像一臺“測光的槍”,卻能揭示土壤和植被的“隱藏信息”。那么,地物光譜儀到底是怎么工作的?它又是如何在科學研究中
    的頭像 發(fā)表于 05-20 15:46 ?159次閱讀
    地物光譜儀如何幫助<b class='flag-5'>科學家</b>研究植被和土壤?

    云天勵飛董事長陳寧當選深圳市青年科學家協(xié)會第十屆會長

    ? 2025年3月29日,深圳市青年科學家協(xié)會十屆一次會員大會在深圳市青少年活動中心南廳隆重舉行。百余位青年才俊齊聚一堂,共同見證協(xié)會換屆選舉,共話科技創(chuàng)新未來。共青團深圳市委員會書記胡火明出席了
    的頭像 發(fā)表于 03-31 19:15 ?828次閱讀
    云天勵飛董事長陳寧當選深圳市青年<b class='flag-5'>科學家</b>協(xié)會第十屆會長

    我國科學家制備出可控手性石墨烯卷

    日前,我國科學家開發(fā)了一種名為“石蠟輔助浸入法”的新技術,成功讓二維材料“卷起來”,制備出具有可控手性的石墨烯卷,為未來量子計算和自旋電子器件的發(fā)展奠定了堅實基礎。 由天津大學教授胡文平、雷圣賓、李
    的頭像 發(fā)表于 02-26 11:17 ?484次閱讀

    NVIDIA RAPIDS cuDF如何賦能AI加速數(shù)據(jù)科學

    隨著 AI 正幫助各行各業(yè)推動創(chuàng)新和提高效率,基于海量的高質(zhì)量數(shù)據(jù)來訓練各種模型是充分發(fā)揮 AI 應用潛力的必經(jīng)之路,正因如此,數(shù)據(jù)科學家們面臨著日益增長的工作負載需求,迫切需求尋找高
    的頭像 發(fā)表于 01-24 09:26 ?610次閱讀

    深開鴻亮相“小小科學家”品牌發(fā)布暨科學探索研學營開營活動

    為在青少年中營造學科學、愛科學、用科學的濃厚氛圍,1月14日,由市委組織部、市委教育工委、團市委共同主辦的“小小科學家”品牌發(fā)布暨科學探索研
    的頭像 發(fā)表于 01-15 21:17 ?570次閱讀
    深開鴻亮相“小小<b class='flag-5'>科學家</b>”品牌發(fā)布暨<b class='flag-5'>科學</b>探索研學營開營活動

    AI 推動未來科學 晶泰科技共襄未來科學大獎周

    科學家,探討學科交叉與學術創(chuàng)新,傾力打造兼具權威性、專業(yè)性和國際影響力的科學盛會。 未來科學大獎由未來論壇于 2016 年創(chuàng)設,被譽為"中國諾貝爾獎"。未來論壇是當前中國極具聲望的民間科學
    的頭像 發(fā)表于 12-18 09:58 ?421次閱讀
    AI 推動未來<b class='flag-5'>科學</b> 晶泰科技共襄未來<b class='flag-5'>科學</b>大獎周

    西湖大學:科學家+AI,科研新范式的樣本

    研究,創(chuàng)新科研新范式。這一點在西湖大學的科研項目中已得到體現(xiàn)。 成立于2018年的西湖大學是由施一公院士領銜創(chuàng)辦的、聚焦前沿科學研究的研究型大學,該校鼓勵科學家們探索AI與各學科交叉融合,為科研創(chuàng)新提速。為此,西湖大學在浪潮信息等企業(yè)助力下打造
    的頭像 發(fā)表于 12-12 15:59 ?579次閱讀
    西湖大學:<b class='flag-5'>科學家</b>+AI,科研新范式的樣本

    華為自動駕駛科學家陳亦倫投身具身智能創(chuàng)業(yè)

    近日,華為車BU自動駕駛領域的昔日明星科學家陳亦倫,如今已開啟了一段全新的創(chuàng)業(yè)旅程。據(jù)可靠消息,陳亦倫在今年7月正式創(chuàng)立了名為“它石智航”的新公司,專注于具身智能領域的研發(fā)與創(chuàng)新。 與陳亦倫攜手共進
    的頭像 發(fā)表于 11-28 10:25 ?568次閱讀

    螞蟻集團收購邊塞科技,吳翼出任強化學習實驗室首席科學家

    學習領域的研究與發(fā)展。令人矚目的是,邊塞科技的創(chuàng)始人吳翼已正式加入該實驗室,并擔任首席科學家一職。 吳翼在其個人社交平臺上對這一變動進行了回應。他表示,自己最近接受了螞蟻集團的邀請,負責大模型強化學習領域的研究工
    的頭像 發(fā)表于 11-22 11:14 ?1567次閱讀

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

    了傳統(tǒng)學科界限,使得科學家們能夠從更加全面和深入的角度理解生命的奧秘。同時,AI技術的引入也催生了一種全新的科學研究范式,即數(shù)據(jù)驅(qū)動的研究范式,這種范式強調(diào)從大量數(shù)據(jù)中提取有價值的信息
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得

    如何激發(fā)科學家的創(chuàng)新思維。AI不僅僅是工具,更是一種思維方式,它鼓勵我們跳出傳統(tǒng)框架,以數(shù)據(jù)為驅(qū)動,探索未知。這種思維方式的轉變,不僅促進了科學方法的革新,也為解決全球性挑戰(zhàn)提供了新的視角和途徑
    發(fā)表于 10-14 09:12

    上海科學家精準操控原子“人造”藍寶石 為低功耗芯片研制開辟新路

    當芯片中的晶體管隨著摩爾定律向納米級不斷縮小時,發(fā)揮絕緣作用的介質(zhì)材料卻因為厚度縮小而性能快速降低。如何為更小的晶體管匹配更佳的介質(zhì)材料,成為集成電路領域科學家們的苦苦追尋的目標。 如今,中國科學
    的頭像 發(fā)表于 08-09 15:38 ?657次閱讀

    科學家開發(fā)出首臺可見光飛秒光纖激光器

    光纖激光器的實驗裝置圖 加拿大拉瓦爾大學科學家開發(fā)出了第一臺可在電磁光譜的可見光范圍內(nèi)產(chǎn)生飛秒脈沖的光纖激光器,這種能產(chǎn)生超短、明亮可見波長脈沖的激光器可廣泛應用于生物醫(yī)學、材料加工等領域。通常產(chǎn)生
    的頭像 發(fā)表于 07-25 06:43 ?633次閱讀
    <b class='flag-5'>科學家</b>開發(fā)出首臺可見光飛秒光纖激光器

    受人眼啟發(fā)!科學家開發(fā)出新型改良相機

    新型事件相機系統(tǒng)與標準事件相機系統(tǒng)對比圖。 馬里蘭大學計算機科學家領導的一個研究小組發(fā)明了一種照相機裝置,可以改善機器人觀察周圍世界并做出反應的方式。受人眼工作原理的啟發(fā),他們的創(chuàng)新型照相機系統(tǒng)模仿
    的頭像 發(fā)表于 07-22 06:24 ?557次閱讀
    受人眼啟發(fā)!<b class='flag-5'>科學家</b>開發(fā)出新型改良相機

    中國科學家發(fā)現(xiàn)新型高溫超導體

    據(jù)新華社報道,我國科學家再立新功,又一新型高溫超導體被發(fā)現(xiàn)。 復旦大學物理學系趙俊團隊利用高壓光學浮區(qū)技術成功生長了三層鎳氧化物,成功證實在鎳氧化物中具有壓力誘導的體超導電性,而且超導體積分數(shù)達到
    的頭像 發(fā)表于 07-19 15:14 ?1178次閱讀