99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

MIT開發(fā)數(shù)據(jù)分析師的“無界畫布”

Hf1h_BigDataDig ? 來源:YXQ ? 2019-07-11 15:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

還記得《復仇者聯(lián)盟2》里面鋼鐵俠和班納博士創(chuàng)造奧創(chuàng)的時候,使用全息投影將三維數(shù)據(jù)投射到空氣中,然后直接用雙手操控這些數(shù)據(jù)的畫面嗎?

遺憾的是,這樣的系統(tǒng)目前尚未成為現(xiàn)實。

是什么限制了我們像鋼鐵俠一樣操作數(shù)據(jù)呢?如果暫時還想不到答案,不如我們先來看一下要實現(xiàn)這個需要哪些技術吧。

首先肯定是全息投影,很多人可能認為,限制這個技術的肯定是沒有這么好的全息投影,誠然,全息投影目前還尚未成熟,但是以目前的發(fā)展來看,并不是說現(xiàn)有的技術不能將數(shù)據(jù)表實時投影到三維空間中,還記得五月中旬被Magic Leap收購的Mimesys公司么?我們來看看這家公司已經將全息投影做到什么地步了。

建筑模型和人都進行了全息投影,而且人還可以對模型進行交互操作,是不是有點賽博朋克?

也就是說,盡管在邊界的處理還存在一些瑕疵,但是將數(shù)據(jù)表投影到空氣中并進行操作,并不是遙不可及的。

那是究竟什么封印了Stark的出現(xiàn)?

答案是智能。因為就算我們將各種數(shù)據(jù)表投影到了空氣中,并且各種諸如手環(huán)、指環(huán)的傳感器也能夠將我們的動作反映給計算機形成指令,但是如果沒有智能,我們實現(xiàn)的僅僅就是用了更加炫酷的姿勢來操作Excel而已。你將一個表格拖過來,也就實現(xiàn)了ctrl+c&ctrl+v。

兩家高校的研究員正在嘗試突破這個瓶頸。

不久之前,麻省理工學院和布朗大學的研究人員開發(fā)了一個在觸摸屏上運行的交互式智能數(shù)據(jù)分析系統(tǒng),名為Northstar,該系統(tǒng)在云中運行,而且其界面支持任何觸摸屏設備,包括智能手機和大型交互式顯示屏。

更關鍵的是,它可以根據(jù)用戶操作實時生成機器學習模型,從而在其數(shù)據(jù)集上運行預測任務。

而這,得益于一項新的AutoML組件:VDS

迄今為止最快的交互式AutoML工具——VDS

VDS首先出現(xiàn)在ACM SIGMOD會議上發(fā)表的一篇論文中,利用的是現(xiàn)在比較火的人工智能技術——自動機器學習(AutoML),它可以讓沒有數(shù)據(jù)科學知識的人根據(jù)他們的數(shù)據(jù)集訓練AI模型進行預測。

例如,醫(yī)生可以使用該系統(tǒng)來幫助預測哪些患者更容易患某些疾病,而企業(yè)主也可以通過該系統(tǒng)預測銷售情況。用戶也可以通過使用交互式顯示屏進行實時協(xié)作。這個系統(tǒng)的目的是使用戶更容易進行復雜的數(shù)據(jù)分析,同時保證分析的速度和準確度,在此基礎上實現(xiàn)數(shù)據(jù)科學的大眾化。

“即使是不了解數(shù)據(jù)科學的咖啡店老板也應該能夠預測未來幾周內他們的銷售情況,以確定要進多少貨”,論文的共同作者和長期擔任Northstar項目的負責人Tim Kraska說。他是麻省理工學院計算機科學和人工智能實驗室(CSAIL)的電氣工程和計算機科學副教授,也是新數(shù)據(jù)系統(tǒng)和人工智能實驗室(DSAIL)的創(chuàng)始人之一。

目前,自動機器學習技術的優(yōu)化基于DARPA D3M自動機器學習競賽,該競賽每六個月決出一次性能最佳的AutoML工具。

數(shù)據(jù)分析師的“無界畫布”

這一新成果建立在麻省理工學院和布朗研究員在Northstar的多年合作基礎之上。四年多來,研究人員發(fā)表了大量論文,詳細介紹Northstar組件,包括交互式界面,多平臺操作,加速運行結果以及用戶行為研究。

Northstar系統(tǒng)以空白白色界面開始。用戶將數(shù)據(jù)集上載到系統(tǒng)之后,該數(shù)據(jù)集會顯示在左側的“數(shù)據(jù)集”框中。任何數(shù)據(jù)標簽都會自動填充進界面下方的“屬性”框。界面上還有一個“運算符”框,其中包含各種算法,以及新的AutoML工具。所有數(shù)據(jù)都在云中存儲和分析。

下面讓我們用一個例子詳細論述:

設想一群醫(yī)學研究人員,他們想要探究某年齡組中特定疾病并發(fā)可能性。

他們將模式檢查算法拖放到界面中間,該算法最初顯示為空白框。

作為輸入,他們將標記好的疾病特征如“血液”、“傳染性”和“代謝”移動到算法框中。

隨后,算法框中就會顯示這些疾病的百分比。如果他們將“年齡”特征拖到界面中,該界面就會出現(xiàn)另外一個框,框內會顯示患者年齡分布的條形圖。

最后,在兩個框之間畫一條線將它們連接在一起,算法就會立即自動計算圍繞不同年齡范圍的三種疾病的關聯(lián)和并發(fā)現(xiàn)象。

“這就像一個大而無界的畫布,你可以在這里展示你想要的一切”,Northstar互動界面的主要開發(fā)者的Zgraggen說,“你還可以將所有內容鏈接在一起,以處理更復雜的問題”。

通過VDS,用戶現(xiàn)在還可以通過個性化模型,使其適合自己的分析任務,并在自己的數(shù)據(jù)集上進行預測分析,例如數(shù)據(jù)預測,圖像分類或分析復雜圖形結構。

以上述的醫(yī)學探究為例,醫(yī)學研究人員希望根據(jù)數(shù)據(jù)集中的特征預測哪些患者可能患有血液疾病。他們從算法列表中將“AutoML”拖入數(shù)據(jù)集中。系統(tǒng)首先會產生一個帶有“目標”標簽的空白框。研究人員將“血液”這一標簽拖到空白框。系統(tǒng)將自動找到性能最佳的機器學習算法,以不斷更新的精度百分比的選項卡顯示。用戶可以隨時停止該過程,優(yōu)化搜索,并檢查每個模型的錯誤率,結構,計算和其他事項。

請看視頻演示:

實時智能交互,才是真正的交互

據(jù)研究人員的介紹,VDS是迄今為止最快的交互式AutoML工具,這部分歸功于他們定制的“估算引擎”。引擎位于界面和云存儲之間。引擎自動創(chuàng)建數(shù)據(jù)集的幾個代表性樣本進行逐步處理,從而在幾秒鐘內生成高質量的結果。

“我們花了兩年時間設計VDS,使之契合數(shù)據(jù)科學家的思維方式,”論文的另一位作者Shang說。VDS可以根據(jù)各種編譯規(guī)則,立即確定哪些模型和預處理步驟是不是應該為用戶提前實現(xiàn)。

在機器學習模型的選擇上,它可以從那些大量的機器學習算法列表中選擇并在樣本集上運行模擬,同時記錄結果并優(yōu)化選擇。在提供快速近似結果后,系統(tǒng)還會在后端細化結果。

“至于預測,用戶不希望等待四個小時才能獲得第一個結果。用戶希望看到實時發(fā)生的事情,這樣如果發(fā)現(xiàn)了錯誤,用戶可以立即糾正它。但這在任何其他系統(tǒng)中通常是不可能的”,Kraska說。

研究人員在300個真實數(shù)據(jù)集上對工具進行評估。與其他最先進的AutoML系統(tǒng)相比,VDS預測的準確度大致相同,但VDS的預測結果可以在幾秒鐘內生成,這比其他工具快得多,后者往往需要在幾分鐘到幾小時內才能運行出結果。

有了Northstar的VDS組件,我們得到了一個二維空間的交互式智能數(shù)據(jù)分析系統(tǒng),也許離鋼鐵俠的實驗室還有點距離,但是如果有一天Northstar將全息投影加到下一代分析系統(tǒng)中,那么——也許我就可以坐在沙發(fā)上小手一揮:“Javis,把我這個表做好發(fā)給老板?!?/p>

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • MIT
    MIT
    +關注

    關注

    3

    文章

    254

    瀏覽量

    24405
  • 數(shù)據(jù)分析

    關注

    2

    文章

    1472

    瀏覽量

    35014

原文標題:MIT開發(fā)數(shù)據(jù)分析師的“無界畫布”:實時交互預測,可拖拽的AutoML系統(tǒng)

文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    芯片制造的畫布:晶圓的奧秘與使命

    芯片制造的畫布 芯片制造的畫布:晶圓的奧秘與使命 在芯片制造的宏大舞臺上,晶圓(Wafer)扮演著至關重要的角色。它如同一張潔白的畫布,承載著無數(shù)工程的智慧與夢想,見證著從砂礫到智能
    的頭像 發(fā)表于 03-10 17:04 ?502次閱讀

    智能焊接數(shù)據(jù)分析設備提升工業(yè)效率與精度

    隨著科技的不斷進步,智能制造已經成為推動工業(yè)4.0發(fā)展的關鍵力量。在眾多的智能制造技術中,智能焊接數(shù)據(jù)分析設備因其在提高生產效率和焊接質量方面的顯著效果而受到廣泛關注。本文將探討智能焊接數(shù)據(jù)分析設備
    的頭像 發(fā)表于 01-15 14:11 ?432次閱讀

    Mathematica 在數(shù)據(jù)分析中的應用

    數(shù)據(jù)分析是現(xiàn)代科學研究和商業(yè)決策中不可或缺的一部分。隨著數(shù)據(jù)量的爆炸性增長,對數(shù)據(jù)分析工具的需求也在不斷增加。Mathematica,作為一種強大的計算軟件,以其獨特的符號計算能力和廣泛的內置函數(shù)庫
    的頭像 發(fā)表于 12-26 15:41 ?692次閱讀

    數(shù)據(jù)可視化與數(shù)據(jù)分析的關系

    在當今這個信息爆炸的時代,數(shù)據(jù)無處不在。無論是企業(yè)運營、科學研究還是個人決策,我們都需要從海量的數(shù)據(jù)中提取有價值的信息。數(shù)據(jù)分析數(shù)據(jù)可視化作為兩個關鍵的工具,它們幫助我們理解、解釋和
    的頭像 發(fā)表于 12-06 17:09 ?947次閱讀

    NVIDIA助力百度提升數(shù)據(jù)分析效能

    、數(shù)據(jù)分析師、運營團隊以及銷售人員等。過去他們不得不編寫繁雜的查詢語句,由此耗費掉大量的時間與精力。百度廣告業(yè)務的重要性和復雜性,致使相關的業(yè)務數(shù)據(jù)每月會有超過 200 個迭代更新,用戶唯有掌握豐富的業(yè)務領域知識方可成功實施數(shù)據(jù)分析
    的頭像 發(fā)表于 11-20 10:06 ?698次閱讀

    LLM在數(shù)據(jù)分析中的作用

    隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)分析已經成為企業(yè)和組織決策的關鍵工具。數(shù)據(jù)科學家和分析師需要從海量數(shù)據(jù)中提取有價值的信息,以支持業(yè)務決策。在這個過
    的頭像 發(fā)表于 11-19 15:35 ?1108次閱讀

    eda與傳統(tǒng)數(shù)據(jù)分析的區(qū)別

    EDA(Exploratory Data Analysis,探索性數(shù)據(jù)分析)與傳統(tǒng)數(shù)據(jù)分析之間存在顯著的差異。以下是兩者的主要區(qū)別: 一、分析目的和方法論 EDA 目的 :EDA的主要目的是對
    的頭像 發(fā)表于 11-13 10:52 ?879次閱讀

    為什么選擇eda進行數(shù)據(jù)分析

    數(shù)據(jù)科學領域,數(shù)據(jù)分析是一個復雜且多步驟的過程,它涉及到數(shù)據(jù)的收集、清洗、探索、建模和解釋。在這些步驟中,探索性數(shù)據(jù)分析(EDA)扮演著至關重要的角色。 1. 理解
    的頭像 發(fā)表于 11-13 10:41 ?744次閱讀

    raid 在大數(shù)據(jù)分析中的應用

    RAID(Redundant Array of Independent Disks,獨立磁盤冗余陣列)在大數(shù)據(jù)分析中的應用主要體現(xiàn)在提高存儲系統(tǒng)的性能、可靠性和容量上。以下是RAID在大數(shù)據(jù)分析
    的頭像 發(fā)表于 11-12 09:44 ?720次閱讀

    SUMIF函數(shù)在數(shù)據(jù)分析中的應用

    在商業(yè)和科學研究中,數(shù)據(jù)分析是一項基本且關鍵的技能。Excel作為最常用的數(shù)據(jù)分析工具之一,提供了多種函數(shù)來幫助用戶處理和分析數(shù)據(jù)。SUMIF函數(shù)就是其中之一,它允許用戶根據(jù)特定的條件
    的頭像 發(fā)表于 11-11 09:14 ?867次閱讀

    智能制造中的數(shù)據(jù)分析應用

    隨著工業(yè)4.0的推進,智能制造已經成為制造業(yè)轉型升級的關鍵。數(shù)據(jù)分析作為智能制造的核心驅動力,正逐步改變傳統(tǒng)的生產方式,為企業(yè)帶來更高的效率和更大的競爭力。 一、數(shù)據(jù)分析在智能制造中的重要性 提高
    的頭像 發(fā)表于 11-07 09:56 ?873次閱讀

    數(shù)據(jù)分析在數(shù)字化中的作用

    在當今這個信息爆炸的時代,數(shù)據(jù)無處不在。從個人的日常活動到企業(yè)的商業(yè)決策,數(shù)據(jù)都在發(fā)揮著越來越重要的作用。數(shù)字化轉型,作為企業(yè)適應這一變化的關鍵策略,正逐漸成為各行各業(yè)的共識。 1. 數(shù)據(jù)分析的定義
    的頭像 發(fā)表于 10-27 17:35 ?1135次閱讀

    云計算在大數(shù)據(jù)分析中的應用

    云計算在大數(shù)據(jù)分析中的應用廣泛且深入,它為用戶提供了存儲、計算、分析和預測的強大能力。以下是對云計算在大數(shù)據(jù)分析中應用的介紹: 一、存儲和處理海量數(shù)據(jù) 云計算提供了強大的存儲和計算能力
    的頭像 發(fā)表于 10-24 09:18 ?1105次閱讀

    使用AI大模型進行數(shù)據(jù)分析的技巧

    使用AI大模型進行數(shù)據(jù)分析的技巧涉及多個方面,以下是一些關鍵的步驟和注意事項: 一、明確任務目標和需求 在使用AI大模型之前,首先要明確數(shù)據(jù)分析的任務目標,這將直接影響模型的選擇、數(shù)據(jù)收集和處理方式
    的頭像 發(fā)表于 10-23 15:14 ?2742次閱讀

    IP 地址大數(shù)據(jù)分析如何進行網絡優(yōu)化?

    一、大數(shù)據(jù)分析在網絡優(yōu)化中的作用 1.流量分析數(shù)據(jù)分析可以對網絡中的流量進行實時監(jiān)測和分析,了解網絡的使用情況和流量趨勢。通過對流量數(shù)據(jù)
    的頭像 發(fā)表于 10-09 15:32 ?566次閱讀
    IP 地址大<b class='flag-5'>數(shù)據(jù)分析</b>如何進行網絡優(yōu)化?