99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為什么說數學知識是數據科學家的先決條件?

DPVg_AI_era ? 來源:lq ? 2019-01-29 09:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI機器學習的火熱讓數據科學家成為近幾年熱門職業(yè)之一。但對于試圖從事這一職業(yè)的新人來說,數學可能最大的攔路虎之一。不過本文作者認為,當數據科學家并不一定需要堅實的數學基礎,并給出了9類無需數學基礎的數據科學任務。

在當今世界上,數據科學和機器學習已成為最令人向往的職業(yè)方向之一,從大學生到職業(yè)生涯中期的專業(yè)人士,很多人都希望進入數據科學領域。但是,在追求數據科學或機器學習領域時想到的第一個先決條件是,要具備深入研究復雜數學問題的能力,才能走進數據科學的大門。

但是那些數學基礎薄弱,不具備扎實數學背景的人怎么辦?他們就沒有希望進入數據科學領域了嗎?

當然不是。本文將提供踏入數據科學和機器學習世界之前,是否強制要求數學背景知識的真實情況。

為什么說數學知識是數據科學家的先決條件?

與大學其他專業(yè)相比,數據科學更多地是關于如何快速準確地學習。通過嚴格的數學運算,快速準確地掌握技術,并且通常可以比大多數人更容易地學習。

數據科學家基本上都是統計學家,大多數人擁有研究生水平的數學和統計學知識。這是從事實際項目所必需的知識,對于正確使用算法和假設檢驗至關重要。

掌握邏輯回歸、決策樹、置信區(qū)間等標準數學工具也很重要。大多數企業(yè)都會使用這些標準工具。因此,招聘人員也傾向于尋找具備扎實數學背景的求職者,這主要是出于歷史原因。

堅持使用標準的數學訓練和標準工具,對有興趣成為硬核數據科學家的人是非常有用的。

數據科學家需要掌握哪些知識呢?

一位優(yōu)秀的數據科學家或工程師必須具備豐富的數據庫知識和工程實踐知識。包括處理和記錄錯誤、監(jiān)控系統,構建人為錯誤容錯渠道,了解擴展項目所需的條件、處理持續(xù)整合問題、掌握數據庫管理知識,維護數據清理以及確保確定性處理流程等。

凡事有例外,高中數學水平的人也有機會

實際上,在機器學習的所有方面的技術中,數據科學背后的統計引擎并不涉及高中以后的任何數學或統計理論。

如果具備強大的數據和編程背景,任何人都可以非常快速地學習數據科學。

不過,由硬核數學導向的數據科學家開發(fā)的一些技術并不使用數學或統計學,這些技術同樣有效,其中一些技術已經被證明不輸于使用數學的同類技術,而且性能通常更加強大。此外,這些技術更易于理解,并且可解釋性更強。

數據科學家的實際工作有多少和數學有關?

打破神話,揭示現實。

從入門級數據科學家到中級數據科學家,一般花在數學上的時間不到5%,機器學習也是如此,尤其是建立模型時,很少有時間做任何數學上的工作。對于機器學習,需要學習的真正的必要技能是數據分析,以便建立能夠進行準確預測的模型。初學者其實不需過多掌握微積分和線性代數。

只有參與學術上的機器學習研究或者少數先進的數據科學家團隊時,數學的作用才顯得特別重要。高水平的業(yè)內人士也經常使用高等數學。一些人正在拓展機器學習研究人員的研究邊界。

像谷歌和Facebook這樣的公司中,人們只會在工作中經常使用微積分、線性代數和更高級的數學工具。

最重要的是,在產業(yè)界中,數據科學家只是沒有將太多時間花在數學上,但花了大量時間來獲取數據、清理數據、探索數據。實際上,80%的人所做的是數據整理和數據的可視化。

9類無需數學技術的數據科學任務

1、使用基本的Excel進行高級機器學習:此方法是一種輕量級的技術實現,包括非常簡單易懂的基本Excel實現。目前可用于Python、Perl,Julia和R。未來預計還將支持SQL實現。

2、使用HDT進行自動化的機器學習:此方法融合了名為“決策樹”和“回歸”的兩種傳統技術。但是這種實現不涉及任何節(jié)點分割或任何傳統的回歸模型,回歸部分是與數學無關的Jack-knife回歸。早期版本使用邏輯回歸,但由于數據轉換過程比較簡單,使用的參數較少,導致邏輯回歸被Jack-knife回歸所取代。

3、無模型置信區(qū)間:需要對隨機變量和概率分布有基本的了解才能知道置信區(qū)間的概念。這類置信區(qū)間方法基于百分位數,非常易于理解,無需數學知識且可靠性高,可用于預測分析。

4、假設檢驗:這是學生在統計課程中的難題之一。這里已被置信區(qū)間的簡單變體所取代,便于直觀理解。

5、使用Excel的Jack-knife回歸:這些回歸技術非常簡單高效,可以在Excel或SQL中輕松實現。

6、Jack-knife回歸:理論 – 無須統計理論的回歸,甚至不涉及線性代數。不過帶有置信區(qū)間。在該方法中,即使使用少量元參數,與經典回歸相比,也能實現最低限度的精度損失。該方法在存在異常值、高度相關的特征或其他違反假設的情況下性能良好,這些假設條件在使用傳統回歸時必須通過一個數據集滿足。

7、索引,編目和NLP:無需數學知識的監(jiān)督聚類方法。

8、快速組合特征選擇:這種方法通常需要理解隨機變量的概念。

9、方差,聚類和密度估計:這些方法中也不大涉及數學。

要成為高效的數據科學家,還是要懂點數學的

其實,這里的關鍵點是,對于初出茅廬的數據科學家和機器學習從業(yè)者來說,數據專業(yè)知識的重要性要優(yōu)于數學專業(yè)知識,因此,如果你的目標是獲得一份工作,進入數據科學領域,那么最重要的任務是必須掌握數據分析,而不是掌握微積分。數據科學家要做的不是做證明題或研究數學問題,能夠分析數據才是最重要的。

初學者需要盡快掌握如何收集數據、探索和準備數據。全面掌握數據可視化和數據處理(包括聚合)是關鍵環(huán)節(jié),這樣才可以同時使用它們來執(zhí)行探索性數據分析任務。

盡管這些無需數學知識的工具和方法,確實凸顯了在不具備堅實數學基礎的情況下從事數據科學的可能性,但并一定能夠滿足行業(yè)的期望,因為能否獲得數據科學家的職位,完全取決于你從事的工作內容,以及你心儀的公司究竟從事什么業(yè)務。

在不具備數學背景知識的情況下,確實有可能成為一名數據科學家。但按以往經驗來看,如果沒有一定程度的數學素養(yǎng),從長期而言,很難成為一個高效的數據科學家,而高效這一點無疑是更為重要的。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8501

    瀏覽量

    134577
  • 數據科學
    +關注

    關注

    0

    文章

    168

    瀏覽量

    10483

原文標題:不懂數學,照樣做數據科學家

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    PCB層疊結構設計的先決條件

    )出發(fā),深入探討PCB多層板的層疊結構設計的先決條件。 一、Core和PP的簡要介紹 Core是PCB多層板的核心組成部分,它的兩個表層都鋪有銅箔,可作為信號層、電源層、地層等導電層。Core的上、下表層之間填充的是固態(tài)材料,具有良好的機械強度和電氣性能。而PP則是一種半固態(tài)的樹脂
    的頭像 發(fā)表于 06-06 15:37 ?371次閱讀
    PCB層疊結構設計的<b class='flag-5'>先決條件</b>

    地物光譜儀如何幫助科學家研究植被和土壤?

    在遙感、生態(tài)、農業(yè)等研究領域,科學家們常常會提到一個工具: 地物光譜儀 。它看起來像一臺“測光的槍”,卻能揭示土壤和植被的“隱藏信息”。那么,地物光譜儀到底是怎么工作的?它又是如何在科學研究中
    的頭像 發(fā)表于 05-20 15:46 ?158次閱讀
    地物光譜儀如何幫助<b class='flag-5'>科學家</b>研究植被和土壤?

    在任何平臺上使用PetaLinux的先決條件

    本篇文章介紹了在任何平臺上使用 PetaLinux 的先決條件。PetaLinux 是一種嵌入式 Linux 軟件開發(fā)套件 (SDK),主要用于基于 FPGA 的系統級芯片 (SoC) 設計或 FPGA 設計。
    的頭像 發(fā)表于 04-24 10:40 ?574次閱讀
    在任何平臺上使用PetaLinux的<b class='flag-5'>先決條件</b>

    云天勵飛董事長陳寧當選深圳市青年科學家協會第十屆會長

    ? 2025年3月29日,深圳市青年科學家協會十屆一次會員大會在深圳市青少年活動中心南廳隆重舉行。百余位青年才俊齊聚一堂,共同見證協會換屆選舉,共話科技創(chuàng)新未來。共青團深圳市委員會書記胡火明出席了
    的頭像 發(fā)表于 03-31 19:15 ?827次閱讀
    云天勵飛董事長陳寧當選深圳市青年<b class='flag-5'>科學家</b>協會第十屆會長

    如何在Mac上下載并安裝SPSDK?

    有人有下載和安裝 SPSDK 的說明嗎?先決條件文檔僅適用于 Windows。
    發(fā)表于 03-31 07:49

    將HDF5格式串行為保存模式格式后,文件大小小于預期怎么解決?

    通過運行 install_prerequisites_tf2.sh,安裝了 TensorFlow* 2 的先決條件。 將 HDF5 格式串行為 SavedModel 格式,但文件大小小于預期。
    發(fā)表于 03-06 06:17

    我國科學家制備出可控手性石墨烯卷

    日前,我國科學家開發(fā)了一種名為“石蠟輔助浸入法”的新技術,成功讓二維材料“卷起來”,制備出具有可控手性的石墨烯卷,為未來量子計算和自旋電子器件的發(fā)展奠定了堅實基礎。 由天津大學教授胡文平、雷圣賓、李
    的頭像 發(fā)表于 02-26 11:17 ?483次閱讀

    深開鴻亮相“小小科學家”品牌發(fā)布暨科學探索研學營開營活動

    為在青少年中營造學科學、愛科學、用科學的濃厚氛圍,1月14日,由市委組織部、市委教育工委、團市委共同主辦的“小小科學家”品牌發(fā)布暨科學探索研
    的頭像 發(fā)表于 01-15 21:17 ?568次閱讀
    深開鴻亮相“小小<b class='flag-5'>科學家</b>”品牌發(fā)布暨<b class='flag-5'>科學</b>探索研學營開營活動

    AI 推動未來科學 晶泰科技共襄未來科學大獎周

    科學家,探討學科交叉與學術創(chuàng)新,傾力打造兼具權威性、專業(yè)性和國際影響力的科學盛會。 未來科學大獎由未來論壇于 2016 年創(chuàng)設,被譽為"中國諾貝爾獎"。未來論壇是當前中國極具聲望的民間科學
    的頭像 發(fā)表于 12-18 09:58 ?419次閱讀
    AI 推動未來<b class='flag-5'>科學</b> 晶泰科技共襄未來<b class='flag-5'>科學</b>大獎周

    西湖大學:科學家+AI,科研新范式的樣本

    研究,創(chuàng)新科研新范式。這一點在西湖大學的科研項目中已得到體現。 成立于2018年的西湖大學是由施一公院士領銜創(chuàng)辦的、聚焦前沿科學研究的研究型大學,該校鼓勵科學家們探索AI與各學科交叉融合,為科研創(chuàng)新提速。為此,西湖大學在浪潮信息等企業(yè)助力下打造
    的頭像 發(fā)表于 12-12 15:59 ?579次閱讀
    西湖大學:<b class='flag-5'>科學家</b>+AI,科研新范式的樣本

    AI for Science:人工智能驅動科學創(chuàng)新》第4章-AI與生命科學讀后感

    了傳統學科界限,使得科學家們能夠從更加全面和深入的角度理解生命的奧秘。同時,AI技術的引入也催生了一種全新的科學研究范式,即數據驅動的研究范式,這種范式強調從大量數據中提取有價值的信息
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅動科學創(chuàng)新》第一章人工智能驅動的科學創(chuàng)新學習心得

    如何激發(fā)科學家的創(chuàng)新思維。AI不僅僅是工具,更是一種思維方式,它鼓勵我們跳出傳統框架,以數據為驅動,探索未知。這種思維方式的轉變,不僅促進了科學方法的革新,也為解決全球性挑戰(zhàn)提供了新的視角和途徑
    發(fā)表于 10-14 09:12

    SAP B1 Web Client &amp; MS Teams App集成連載一:先決條件/Prerequisites

    一、先決條件/Prerequisites 在設置 SAP Business One 應用之前,確保您已具備以下各項:Before you set up the SAP Business One
    的頭像 發(fā)表于 09-14 16:29 ?372次閱讀
    SAP B1 Web Client &amp; MS Teams App集成連載一:<b class='flag-5'>先決條件</b>/Prerequisites

    受人眼啟發(fā)!科學家開發(fā)出新型改良相機

    新型事件相機系統與標準事件相機系統對比圖。 馬里蘭大學計算機科學家領導的一個研究小組發(fā)明了一種照相機裝置,可以改善機器人觀察周圍世界并做出反應的方式。受人眼工作原理的啟發(fā),他們的創(chuàng)新型照相機系統模仿
    的頭像 發(fā)表于 07-22 06:24 ?556次閱讀
    受人眼啟發(fā)!<b class='flag-5'>科學家</b>開發(fā)出新型改良相機

    中國科學家發(fā)現新型高溫超導體

    據新華社報道,我國科學家再立新功,又一新型高溫超導體被發(fā)現。 復旦大學物理學系趙俊團隊利用高壓光學浮區(qū)技術成功生長了三層鎳氧化物,成功證實在鎳氧化物中具有壓力誘導的體超導電性,而且超導體積分數達到
    的頭像 發(fā)表于 07-19 15:14 ?1176次閱讀