99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

一文詳談人工智能的數(shù)據(jù)標注

如意 ? 來源:快資訊 ? 作者:快資訊 ? 2020-07-01 15:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)標注是大多數(shù)人工智能的基礎,它決定了機器學習深度學習模型的質(zhì)量。今天的數(shù)據(jù)呈現(xiàn)指數(shù)級的爆發(fā),比如僅在2018年,就產(chǎn)生了超過30 ZB的數(shù)據(jù)。而在在任何人工智能項目中,對于數(shù)據(jù)科學家而言,數(shù)據(jù)問題都是其中的癥結(jié)所在。

什么是數(shù)據(jù)標注?

訓練機器學習和深度學習模型,需要豐富的數(shù)據(jù),以便將其用于部署,訓練和調(diào)整模型。訓練機器學習和深度學習模型需要大量經(jīng)過仔細標注的數(shù)據(jù)。標注原始數(shù)據(jù)并準備將其應用于機器學習模型和其他AI工作流,被稱為數(shù)據(jù)標注。根據(jù)相關統(tǒng)計,數(shù)據(jù)整理在AI項目中消耗了80%以上的時間。

數(shù)據(jù)如何標注?

如今,大多數(shù)數(shù)據(jù)都沒有標注。帶標簽的數(shù)據(jù),意味著標注或注釋目標模型的數(shù)據(jù),以便可以預測。通常,數(shù)據(jù)標注包括數(shù)據(jù)標注,注釋,審核,分類,轉(zhuǎn)錄和處理。

標注的數(shù)據(jù)突出顯示某些特征,并根據(jù)這些特征對其進行分類,可以通過模型分析其模式以預測新的目標。例如,對于自動駕駛汽車中的計算機視覺,AI專業(yè)人員或數(shù)據(jù)標注者可以使用視頻標注工具來指示路牌的位置,并通過行人和其他車輛的位置來訓練模型。

數(shù)據(jù)標注中包含的一系列任務:

1.豐富數(shù)據(jù)的工具

2.質(zhì)量保證

3.流程迭代

4.管理數(shù)據(jù)標簽

5.培訓新的數(shù)據(jù)標簽

6.項目計劃

7.成功指標

8.流程運作

AI專業(yè)人員的數(shù)據(jù)標簽挑戰(zhàn)?

在典型的AI項目中,專業(yè)人員在進行數(shù)據(jù)標注時會遇到以下幾個方面的挑戰(zhàn)。

1.數(shù)據(jù)標簽質(zhì)量低下。數(shù)據(jù)標簽質(zhì)量低可能有很多原因。其中最突出的原因之一是任何企業(yè)或工作流程確實三個決定因素:人員,流程和技術(shù)。

2.無法擴展數(shù)據(jù)標注操作。當數(shù)據(jù)量不斷增長并且業(yè)務或項目需要擴展其容量時,由于大多數(shù)企業(yè)都在內(nèi)部標記數(shù)據(jù),因此它們通常也難以擴展其數(shù)據(jù)標注任務。

3.難以承受的成本和不存在的結(jié)果。企業(yè)和AI項目經(jīng)理通常雇用高薪數(shù)據(jù)科學家和AI專業(yè)人士或一組業(yè)余人員來處理數(shù)據(jù)標簽,而企業(yè)需要承擔高昂的人工成本,當然企業(yè)也會面臨數(shù)據(jù)標簽不確定所帶來的問題,所以合適的專業(yè)人員至關重要。

4.質(zhì)量保證。進行質(zhì)量檢查可以為數(shù)據(jù)標注過程提供重要價值,尤其是在機器學習模型測試和驗證的迭代階段。

誰來標注數(shù)據(jù)?

相關調(diào)查顯示,2019年,企業(yè)在數(shù)據(jù)標簽上的支出超過17億美元。到2024年,這一數(shù)字將達到41億美元。進行數(shù)據(jù)標注工作,除了雇傭?qū)I(yè)的數(shù)據(jù)科學家和AI專家之外,還可以考慮通過其他方式。

雇員。這包括雇用包括AI專業(yè)人員在內(nèi)的全職或兼職員工,參與AI項目的各個方面,其中之一是數(shù)據(jù)標注。

托管團隊。他們是經(jīng)驗豐富,且訓練有素的數(shù)據(jù)標簽團隊。

承包商。他們包括自由職業(yè)者和臨時工。

眾包。企業(yè)可以使用第三方平臺一次性尋找數(shù)據(jù)標注團隊。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1806

    文章

    49011

    瀏覽量

    249356
  • 機器學習
    +關注

    關注

    66

    文章

    8502

    瀏覽量

    134590
  • 深度學習
    +關注

    關注

    73

    文章

    5561

    瀏覽量

    122792
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    數(shù)據(jù)標注與大模型的雙向賦能:效率與性能的躍升

    其自動化能力,反過來推動數(shù)據(jù)標注效率實現(xiàn)數(shù)倍增長,開啟人工智能發(fā)展的全新篇章。、數(shù)據(jù)標注大模型
    的頭像 發(fā)表于 06-04 17:15 ?670次閱讀
    <b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標注</b>與大模型的雙向賦能:效率與性能的躍升

    數(shù)據(jù)標注服務—奠定大模型訓練的數(shù)據(jù)基石

    影響著模型能力的上限。隨著大模型技術(shù)的快速發(fā)展,數(shù)據(jù)標注服務的重要性愈發(fā)凸顯,其面臨的挑戰(zhàn)也日益嚴峻。當前,就標貝科技看來,數(shù)據(jù)標注服務已從簡單的數(shù)
    的頭像 發(fā)表于 03-21 10:30 ?759次閱讀

    啟明云端攜手心大模型,共探人工智能新紀元

    人工智能的浪潮中,大模型技術(shù)以其強大的數(shù)據(jù)處理能力和深度學習能力,正成為推動產(chǎn)業(yè)升級和創(chuàng)新的核心引擎。12月19日,心中國行走進廣州,啟明云端作為心大模型技術(shù)生態(tài)伙伴,有幸出席這
    的頭像 發(fā)表于 12-20 15:58 ?847次閱讀
    啟明云端攜手<b class='flag-5'>文</b>心大模型,共探<b class='flag-5'>人工智能</b>新紀元

    軟通動力入選《人工智能數(shù)據(jù)標注產(chǎn)業(yè)圖譜》

    近日,由中國信息通信研究院、中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟牽頭,聯(lián)合中國電信集團、沈陽市數(shù)據(jù)局、保定高新區(qū)等70多家單位編制完成并發(fā)布了《人工智能數(shù)據(jù)標注
    的頭像 發(fā)表于 12-03 10:18 ?468次閱讀

    標貝科技:AI基礎數(shù)據(jù)服務,人工智能行業(yè)發(fā)展的底層支撐

    隨著不同大模型在語言理解及生成等領域的出色表現(xiàn),大模型別后的規(guī)模規(guī)律不斷強化數(shù)據(jù)在要提升AI性能上的關鍵作用,AI數(shù)據(jù)服務可加速高質(zhì)量數(shù)據(jù)的獲取與標注,推動AI算法的創(chuàng)新與持續(xù)優(yōu)化,是
    的頭像 發(fā)表于 11-14 18:32 ?616次閱讀
    標貝科技:AI基礎<b class='flag-5'>數(shù)據(jù)</b>服務,<b class='flag-5'>人工智能</b>行業(yè)發(fā)展的底層支撐

    嵌入式和人工智能究竟是什么關系?

    人工智能的結(jié)合,無疑是科技發(fā)展中的場革命。在人工智能硬件加速中,嵌入式系統(tǒng)以其獨特的優(yōu)勢和重要性,發(fā)揮著不可或缺的作用。通過深度學習和神經(jīng)網(wǎng)絡等算法,嵌入式系統(tǒng)能夠高效地處理大量數(shù)據(jù)
    發(fā)表于 11-14 16:39

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第6章人AI與能源科學讀后感

    幸得好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動科學創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學領域中的巨大潛力和廣泛應用。這
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

    閱讀這章后,我深感人工智能與生命科學的結(jié)合正引領著場前所未有的科學革命,以下是我個人的讀后感: 1. 技術(shù)革新與生命科學進步 這章詳細闡述了
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第人工智能驅(qū)動的科學創(chuàng)新學習心得

    人工智能:科學研究的加速器 第章清晰地闡述了人工智能作為科學研究工具的強大功能。通過機器學習、深度學習等先進技術(shù),AI能夠處理和分析海量數(shù)據(jù),發(fā)現(xiàn)傳統(tǒng)方法難以捕捉的模式和規(guī)律。這不
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應用前景分析

    RISC-V在人工智能圖像處理領域的應用前景十分廣闊,這主要得益于其開源性、靈活性和低功耗等特點。以下是對RISC-V在人工智能圖像處理應用前景的詳細分析: 、RISC-V的基本特點 RISC-V
    發(fā)表于 09-28 11:00

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析 想問下哪些比較容易學 不過好像都是要學的
    發(fā)表于 09-26 15:24

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領域應用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結(jié)經(jīng)驗,擬按照要求準備相關體會材料??茨芊裼兄谌腴T和提高ss
    發(fā)表于 09-09 15:36

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學創(chuàng)新

    ! 《AI for Science:人工智能驅(qū)動科學創(chuàng)新》 這本書便將為讀者徐徐展開AI for Science的美麗圖景,與大家起去了解: 人工智能究竟幫科學家做了什么? 人工智能
    發(fā)表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI

    呈現(xiàn)、產(chǎn)業(yè)展覽、技術(shù)交流、學術(shù)論壇于體的世界級人工智能合作交流平臺。本次大會暨博覽會由工業(yè)和信息化部政府采購中心、廣東省工商聯(lián)、前海合作區(qū)管理局、深圳市工信局等單位指導,深圳市人工智能產(chǎn)業(yè)協(xié)會主辦
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領域的應用非常廣泛,主要體現(xiàn)在以下幾個方面: 、深度學習加速 訓練和推理過程加速:FPGA可以用來加速深度學習的訓練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05