隨著產(chǎn)業(yè)數(shù)字化帶來的數(shù)據(jù)基礎(chǔ)的日益成熟,人工智能在營銷、金融、數(shù)字政府、零售、醫(yī)療等行業(yè)的落地持續(xù)推進(jìn),并開始帶來顯著的效益。也是隨著人工智能技術(shù)的高速發(fā)展,AI在計(jì)算機(jī)視覺、智能語音領(lǐng)等特定領(lǐng)域?qū)崿F(xiàn)了單點(diǎn)突破,但尚未具備通用性,AI技術(shù)整體還處于依托數(shù)據(jù)驅(qū)動(dòng)的感知智能階段。
目前,數(shù)據(jù)和智能處于密不可分的階段。一方面有數(shù)據(jù)才能實(shí)現(xiàn)智能,人工智能基于數(shù)據(jù)訓(xùn)練,海量和優(yōu)質(zhì)的訓(xùn)練數(shù)據(jù)持續(xù)推動(dòng)AI算法額持續(xù)優(yōu)化,進(jìn)一步提各行各業(yè)應(yīng)用人工智能的水平,讓數(shù)據(jù)價(jià)值得以真正的發(fā)揮;另一方面,人工智能也使得數(shù)據(jù)更加豐富,隨著各種各樣的AI應(yīng)用的落地,越來越多的用戶的使用催生出更多數(shù)據(jù)的產(chǎn)生。
這就造成了隨著算法模型不斷深入垂直行業(yè)的細(xì)分業(yè)務(wù)場景,相對應(yīng)的數(shù)據(jù)標(biāo)注的復(fù)雜度、精準(zhǔn)度等要求都有提升。
首先,要求標(biāo)注人員掌握更復(fù)雜的行業(yè)知識,進(jìn)一步提升了數(shù)據(jù)標(biāo)注的門檻和成本。例如,醫(yī)療領(lǐng)域?qū)︶t(yī)療影像和文本的標(biāo)注,需要具備醫(yī)學(xué)專業(yè)知識的人員進(jìn)行。從數(shù)據(jù)類型來看,文本類、3D圖像類數(shù)據(jù)不斷增加,標(biāo)注復(fù)雜度高于早期的平面圖像類數(shù)據(jù)。
一個(gè)成功的AI應(yīng)用與其他應(yīng)用的差異化對比,更多的來自于精準(zhǔn)大量的訓(xùn)練數(shù)據(jù)??梢哉f,具有更高精準(zhǔn)度的數(shù)據(jù)已成為當(dāng)前訓(xùn)練階段的主流需求。國內(nèi)AI數(shù)據(jù)服務(wù)頭部企業(yè)——云測數(shù)據(jù)在數(shù)據(jù)采集標(biāo)注領(lǐng)域的重要優(yōu)勢之一,就是能提供足夠精準(zhǔn)的訓(xùn)練數(shù)據(jù),因此其最高99.99%的精準(zhǔn)度可較好的應(yīng)對人工智能數(shù)據(jù)精準(zhǔn)度提升的情況,行成企業(yè)護(hù)城河。
其次,對于垂直細(xì)分場景,需要根據(jù)建模需求,采集特定環(huán)境下、特定對象的精準(zhǔn)“小數(shù)據(jù)”,需要更專業(yè)的數(shù)據(jù)采集手段。例如,對于微表情、假表情識別的場景需要“演員”按要求配合表演,汽車碰撞場景數(shù)據(jù)需要在實(shí)驗(yàn)室場景內(nèi)采集。進(jìn)一步地,這些特定業(yè)務(wù)場景數(shù)據(jù)是數(shù)據(jù)擁有方的寶貴資產(chǎn),需要保證數(shù)據(jù)標(biāo)注過程中的安全性。
這些數(shù)據(jù)采集需求相對復(fù)雜、聚焦,難度較大,對AI數(shù)據(jù)服務(wù)商的場景化采集能力提出了很高的要求。隨著人工智能對長尾場景的數(shù)據(jù)需求進(jìn)一步擴(kuò)大,未來,場景數(shù)據(jù)將擁有更廣闊的增量空間,具有相關(guān)采集工具、資源、能力的數(shù)據(jù)采集標(biāo)注服務(wù)商將擁有極大的競爭優(yōu)勢。以云測數(shù)據(jù)為例,為進(jìn)一步滿足場景化數(shù)據(jù)的需求,首創(chuàng)了“數(shù)據(jù)場景實(shí)驗(yàn)室”進(jìn)行相應(yīng)的場景化數(shù)據(jù)生產(chǎn),以滿足AI行業(yè)應(yīng)用場景逐漸趨于長尾和碎片化的趨勢。
人工智能對數(shù)據(jù)提出更高需求,展現(xiàn)了在人工智能產(chǎn)業(yè)化落地進(jìn)程中,數(shù)據(jù)發(fā)揮的重要作用。
現(xiàn)在的人臉識別、自動(dòng)駕駛、語音交互等應(yīng)用,對于各類標(biāo)注數(shù)據(jù)有著海量需求,可以說數(shù)據(jù)的質(zhì)量決定了當(dāng)今人工智能的高度。
而在2020年4月發(fā)布的《中共中央國務(wù)院關(guān)于構(gòu)建更加完善的要素市場化配置體制機(jī)制的意見》中,也明確數(shù)了據(jù)要素市場化配置上升為國家政策,為數(shù)據(jù)的廣泛流動(dòng)和市場價(jià)值轉(zhuǎn)化提供了依據(jù),這將有效支持人工智能在全社會的實(shí)踐。
但由于不同數(shù)據(jù)的復(fù)雜性和差異性,數(shù)據(jù)采集標(biāo)注對于大多數(shù)的數(shù)據(jù)需求方來說并非易事,這背后都離不開具有專業(yè)知識、從業(yè)經(jīng)驗(yàn)和高質(zhì)量數(shù)據(jù)保障的第三方AI數(shù)據(jù)服務(wù)商們。未來,在AI產(chǎn)業(yè)落地應(yīng)用的下半場,人工智能將持續(xù)“加碼”數(shù)據(jù),專業(yè)的AI數(shù)據(jù)服務(wù)商將釋放出更大的價(jià)值,推動(dòng)全行業(yè)的智能化發(fā)展。
責(zé)任編輯:YYX
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7257瀏覽量
91943 -
人工智能
+關(guān)注
關(guān)注
1807文章
49036瀏覽量
249793
發(fā)布評論請先 登錄
最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)
北京將打造最大人工智能社區(qū)
嵌入式和人工智能究竟是什么關(guān)系?
LLM技術(shù)對人工智能發(fā)展的影響
《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感
AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感
《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得
《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得
居民小區(qū)電梯按需維保系統(tǒng)如何發(fā)揮最大作用?
RMON的最大作用是什么?

評論