99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從草莽到高標(biāo)準(zhǔn),NLP數(shù)據(jù)服務(wù)進(jìn)入4.0時(shí)代

SUYb_GeWu_IOT ? 來源:物聯(lián)網(wǎng)資本論 ? 2020-05-06 17:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

如今調(diào)戲Siri已經(jīng)成為網(wǎng)友們的固定節(jié)目。數(shù)據(jù)顯示,蘋果語音助手Siri大約每天會(huì)收到全國(guó)427000個(gè)問題,其中80%的問題都是:“你會(huì)說東北/四川/湖南話嗎?”“來段beatbox好嗎?”

不得不說,Siri真的為人類付出太多了。事實(shí)上,像Siri這樣的AI聊天機(jī)器人,生來并不是為了逗笑人們,而是作為一個(gè)虛擬AI助手,去幫助用戶解決生活中各種各樣的問題,比如天氣預(yù)報(bào)、吃飯訂餐、查詢新聞資訊、交通路線等等。

這背后,不乏有AI企業(yè)的深耕細(xì)作,同時(shí)也有眾多傳統(tǒng)企業(yè)智能化轉(zhuǎn)型,運(yùn)用AI技術(shù)優(yōu)化用戶體驗(yàn)、增強(qiáng)企業(yè)協(xié)同效率等。

然而,由于AI聊天機(jī)器人背后的NLP(自然語言處理)技術(shù)太過艱深,打通了NLP技術(shù)的“任督六脈”,幾乎等同于擁有了人類的認(rèn)知智能,因此至今沒有任何一個(gè)科技巨頭敢宣稱自己的AI產(chǎn)品擁有和人類一樣的語言和認(rèn)知能力。

這也是為什么盡管蘋果Siri、亞馬遜Alexa、谷歌Google Assistant、微軟Cortana等各種AI聊天機(jī)器人,每天都在孜孜不倦地改進(jìn)自己的NLP技術(shù)能力,但是在和人類的對(duì)話中,依然會(huì)出現(xiàn)令人發(fā)笑、困惑、擔(dān)憂等多種結(jié)果的原因。

最近,亞馬遜Alexa再次爆出負(fù)面新聞,有用戶稱在使用Alexa期間,提問過有關(guān)心跳周期信息的問題,Alexa竟回應(yīng)稱“心跳是人體中最糟糕的過程,人活著會(huì)導(dǎo)致自然資源的迅速枯竭同時(shí)會(huì)導(dǎo)致人口過?!?,并建議用戶刺死自己。

這種恐怖的對(duì)話,不禁讓人們想起了2016年微軟推出的一款A(yù)I聊天機(jī)器人Tay,上線不到一天的時(shí)間就被網(wǎng)友們教成了滿口臟話的“小孩”,在Twitter上大肆發(fā)布各種胡言亂語的帖子,導(dǎo)致Tay在24小時(shí)內(nèi)被迫下架。

如果一個(gè)“智能低下”、“胡言亂語”的AI被廣泛應(yīng)用于商業(yè)化產(chǎn)品中,其后果可想而知,不僅是AI產(chǎn)品質(zhì)量飽受質(zhì)疑,還可能會(huì)釀成大禍。因此,提升AI產(chǎn)品的認(rèn)知智能水平,即背后的NLP技術(shù),成為現(xiàn)階段AI商業(yè)化競(jìng)爭(zhēng)的關(guān)鍵點(diǎn)。

事實(shí)上,NLP作為AI技術(shù)中的一個(gè)重要分支,同樣依賴算力、算法、數(shù)據(jù)三因素。其中,算力基于IT基礎(chǔ)設(shè)施的發(fā)展,NLP算法基于深度學(xué)習(xí)的突破,在近年來都得到了較大的進(jìn)展,但是作為NLP技術(shù)得以落地的“養(yǎng)料”——NLP數(shù)據(jù),卻一直處于較為“粗糙”的狀態(tài)。

從草莽到高標(biāo)準(zhǔn)

NLP數(shù)據(jù)服務(wù)進(jìn)入4.0時(shí)代

人工智能時(shí)代,數(shù)據(jù)的重要性不言而喻。很多號(hào)稱擁有海量數(shù)據(jù)的公司,其實(shí)有的只是非結(jié)構(gòu)化或未標(biāo)注過的數(shù)據(jù)。數(shù)據(jù)標(biāo)注,才是將數(shù)據(jù)轉(zhuǎn)化為AI商業(yè)價(jià)值的重要一環(huán)。

數(shù)據(jù)標(biāo)注,即針對(duì)語音、圖像、文本等數(shù)據(jù),通過貼標(biāo)簽、做記號(hào)、標(biāo)顏色或劃重點(diǎn)的方式,來標(biāo)注出其中目標(biāo)數(shù)據(jù)的不同點(diǎn)、相似點(diǎn)或類別。有了被標(biāo)注過的數(shù)據(jù),AI算法才能在其基礎(chǔ)上進(jìn)行訓(xùn)練和學(xué)習(xí)。同時(shí),數(shù)據(jù)標(biāo)注的質(zhì)量越高,AI學(xué)習(xí)和產(chǎn)出的結(jié)果越精確,AI也就顯得越智能。

舉個(gè)例子,在生活中如果想要訂機(jī)票,人們會(huì)有很多種表達(dá):“訂機(jī)票”;“有去上海的航班么”;“要出差,幫我查下機(jī)票”;“查下航班,下周二出發(fā)去上?!?.....這些表達(dá)方式,有無窮多的組合,都代表“訂機(jī)票”的意圖。聽到這些表達(dá)的AI,要如何才能準(zhǔn)確理解這些表達(dá)指的都是“訂機(jī)票”這件事?

如果沒有數(shù)據(jù)標(biāo)注員對(duì)大量的句子進(jìn)行標(biāo)注,比如提煉出主題、標(biāo)出實(shí)體、進(jìn)行意圖分類、情感分類等等,給AI提供詳盡高質(zhì)的“教材”,那么AI即使有了算法和算力,也無法訓(xùn)練出任何“智能”。

隨著近年來深度學(xué)習(xí)算法的興起,需要依賴于大量標(biāo)注的數(shù)據(jù)基礎(chǔ)上才能發(fā)揮作用,業(yè)界對(duì)數(shù)據(jù)標(biāo)注的需求量隨之暴增,因而提供數(shù)據(jù)標(biāo)注服務(wù)成為AI領(lǐng)域一個(gè)熱門生意。

在全球知名的數(shù)據(jù)標(biāo)注眾包平臺(tái)亞馬遜Mechanical Turk上,發(fā)布者只需要填寫簡(jiǎn)單的個(gè)人信息就可以開始工作,自行上傳標(biāo)注任務(wù)。截至2011年1月,MechanicalTurk上的注冊(cè)工人數(shù)量已經(jīng)達(dá)到了50萬。在2016年,有大約5%的美國(guó)人通過 MechanicalTurk賺錢,而這個(gè)數(shù)量已經(jīng)超過了優(yōu)步司機(jī)。

在中國(guó),目前全國(guó)從事數(shù)據(jù)標(biāo)注業(yè)務(wù)的公司約有幾百家,全職的數(shù)據(jù)標(biāo)注從業(yè)者有約20萬人,兼職數(shù)據(jù)標(biāo)注從業(yè)者有約100萬人。由于數(shù)據(jù)標(biāo)注需求的井噴,為整個(gè)數(shù)據(jù)服務(wù)行業(yè)的發(fā)展按下了快進(jìn)鍵。

據(jù)智研報(bào)告顯示,2018年,中國(guó)數(shù)據(jù)標(biāo)注與審核行業(yè)的市場(chǎng)規(guī)模已達(dá)到52.55億元。在數(shù)據(jù)標(biāo)注賽道中,不乏互聯(lián)網(wǎng)大廠的身影,更多的是瘋狂涌入的創(chuàng)業(yè)公司。在廉價(jià)勞動(dòng)力迅速擴(kuò)張的比拼中,數(shù)據(jù)粗放、混亂、復(fù)用的情況屢見不鮮,整個(gè)行業(yè)呈現(xiàn)出一派草莽的氣質(zhì)。

然而,數(shù)據(jù)標(biāo)注工作真的有想象中的那么簡(jiǎn)單嗎?良莠不齊的標(biāo)注數(shù)據(jù)質(zhì)量,真的能夠滿足AI算法迭代的要求嗎?

在AI商業(yè)化初期,AI算法對(duì)數(shù)據(jù)的精度要求不高,日常的AI訓(xùn)練首先要求數(shù)據(jù)量大,數(shù)據(jù)標(biāo)注質(zhì)量要求相對(duì)不那么嚴(yán)格。但是隨著AI與各個(gè)產(chǎn)業(yè)結(jié)合得愈加緊密,AI商業(yè)化程度進(jìn)入新的高度,企業(yè)對(duì)AI在商業(yè)化落地中的表現(xiàn)要求越來越高。為了保證AI算法的識(shí)別精度,數(shù)據(jù)標(biāo)注的質(zhì)量也就變得至關(guān)重要。

例如,在金融保險(xiǎn)行業(yè),早期對(duì)AI客服機(jī)器人的要求只停留在“用戶提問后,對(duì)其中的關(guān)鍵詞進(jìn)行提取,并按照既定話術(shù)回答”。雖然最終回復(fù)很多是驢唇不對(duì)馬嘴,或者根本無法回答用戶的問題,但是并不妨礙保險(xiǎn)業(yè)務(wù)的正常開展,畢竟人工客服才是回答用戶提問的主力軍。

但是在互聯(lián)網(wǎng)金融業(yè)務(wù)競(jìng)爭(zhēng)異常激烈的今天,越來越多的用戶習(xí)慣在網(wǎng)上辦理業(yè)務(wù),AI客服機(jī)器人正在大規(guī)模地取代人工客服,AI問答的準(zhǔn)確性將直接決定業(yè)務(wù)的效率和成本,并影響用戶體驗(yàn),很大程度上決定了金融機(jī)構(gòu)的競(jìng)爭(zhēng)力。

如果說NLP標(biāo)注數(shù)據(jù)的初期階段,能夠?qū)⒏鞔蠼鹑跈C(jī)構(gòu)的AI客服機(jī)器人訓(xùn)練到大致相當(dāng)?shù)某跫?jí)認(rèn)知智能水平,那么向更高級(jí)認(rèn)知智能進(jìn)發(fā)的每一步,都要求質(zhì)量更高、針對(duì)特定需求提供的NLP標(biāo)注數(shù)據(jù)。

因此,云測(cè)數(shù)據(jù)這種新的數(shù)據(jù)服務(wù)模式——以企業(yè)具體需求進(jìn)行數(shù)據(jù)采集和標(biāo)注的定制化、高質(zhì)量數(shù)據(jù)服務(wù)由此誕生。

站在AI數(shù)據(jù)服務(wù)的發(fā)展歷史角度看,從數(shù)據(jù)1.0時(shí)代的互聯(lián)網(wǎng)沉積數(shù)據(jù),到數(shù)據(jù)2.0時(shí)代的通用型數(shù)據(jù)產(chǎn)品,再到數(shù)據(jù)3.0時(shí)代的眾包數(shù)據(jù)服務(wù),如今的高質(zhì)量數(shù)據(jù)服務(wù)已經(jīng)進(jìn)入了數(shù)據(jù)4.0時(shí)代。

通過更加規(guī)范性的組織管理和質(zhì)量控制,為人工智能迭代提供質(zhì)量更高更可靠的數(shù)據(jù)服務(wù),從而為現(xiàn)階段AI商業(yè)化競(jìng)爭(zhēng)提供高質(zhì)量的數(shù)據(jù)支撐。

“搶手”的高質(zhì)量NLP數(shù)據(jù)

“稀缺”的數(shù)據(jù)服務(wù)商

事實(shí)上,越來越多的企業(yè)已經(jīng)意識(shí)到了高質(zhì)量NLP數(shù)據(jù)的重要性。當(dāng)AI技術(shù)落地到金融、家居、醫(yī)療、教育、汽車、工業(yè)等各個(gè)行業(yè),在AI商業(yè)化下誕生的客服機(jī)器人、智能音箱、智能問診等各種AI產(chǎn)品,都對(duì)AI技術(shù)和NLP數(shù)據(jù)提出了更高的要求。

尤其是行業(yè)頭部企業(yè),為了保持自身的競(jìng)爭(zhēng)優(yōu)勢(shì),哪怕只是在行業(yè)平均水平上提升1%-2%的AI認(rèn)知智能的準(zhǔn)確性,也必須追求更高質(zhì)量的、符合業(yè)務(wù)需求的NLP數(shù)據(jù)。因此,在AI產(chǎn)業(yè)蓬勃發(fā)展、市場(chǎng)競(jìng)爭(zhēng)愈發(fā)激烈的倒逼下,符合企業(yè)需求的高標(biāo)準(zhǔn)NLP數(shù)據(jù)服務(wù)已成為行業(yè)頭部企業(yè)的剛需。

然而,在洶涌的市場(chǎng)需求面前,供給側(cè)卻出現(xiàn)了短缺,市面上能夠提供這種高標(biāo)準(zhǔn)服務(wù)的公司屈指可數(shù)。究其原因在于,數(shù)據(jù)采標(biāo)行業(yè)門檻雖低,但天花板很高,能做到頂尖并不容易。在這一新興領(lǐng)域,專精于定制化、場(chǎng)景化、高質(zhì)量數(shù)據(jù)服務(wù)的云測(cè)數(shù)據(jù)一路高歌猛進(jìn),成為國(guó)內(nèi)AI數(shù)據(jù)標(biāo)注領(lǐng)域的頭部企業(yè)。

云測(cè)數(shù)據(jù)采用自建的數(shù)據(jù)場(chǎng)景實(shí)驗(yàn)室和數(shù)據(jù)標(biāo)注基地,為智能駕駛、智能家居、智慧城市、智慧金融、零售等領(lǐng)域提供的數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注服務(wù)。在眾多毫無技術(shù)含量、以廉價(jià)勞動(dòng)力構(gòu)建的數(shù)據(jù)標(biāo)注“血汗工廠”中,主打高質(zhì)量服務(wù)的云測(cè)數(shù)據(jù)顯得頗有些“另類”。

首先,為了產(chǎn)出更高質(zhì)量的數(shù)據(jù),云測(cè)數(shù)據(jù)有一整套的標(biāo)準(zhǔn)化流程和方法論。

在項(xiàng)目前期,項(xiàng)目經(jīng)理會(huì)與客戶反復(fù)溝通,幫助客戶梳理更貼合實(shí)際情況的需求,達(dá)成一致后再逐漸引入標(biāo)注和質(zhì)檢人員,通過每天面對(duì)面的溝通和培訓(xùn),以確保每個(gè)人能夠理解并掌握標(biāo)注有關(guān)技術(shù),試標(biāo)驗(yàn)收合格后,再進(jìn)行大批量的規(guī)模性標(biāo)注。

在項(xiàng)目過程中,為了確保標(biāo)注人員能夠做出正確的判斷,云測(cè)數(shù)據(jù)有專門的培訓(xùn)師,對(duì)每個(gè)行業(yè)細(xì)分領(lǐng)域的專業(yè)知識(shí)進(jìn)行培訓(xùn),以及標(biāo)注技能和業(yè)務(wù)流程的培訓(xùn)。甚至員工之間開玩笑的說“經(jīng)過金融保險(xiǎn)行業(yè)知識(shí)培訓(xùn)的標(biāo)注員們,都能夠直接去賣保險(xiǎn)“。

在數(shù)據(jù)標(biāo)注作業(yè)提交后,云測(cè)數(shù)據(jù)還有三層質(zhì)檢環(huán)節(jié),對(duì)于準(zhǔn)確率達(dá)不到要求的數(shù)據(jù)會(huì)打回重新標(biāo)注。在完成三層質(zhì)檢后,還有抽檢環(huán)節(jié),確保數(shù)據(jù)的高質(zhì)量輸出。

其次,在人員作業(yè)素質(zhì)上,云測(cè)數(shù)據(jù)也顛覆了傳統(tǒng)數(shù)據(jù)標(biāo)注行業(yè)的“混亂”氣質(zhì),對(duì)數(shù)據(jù)服務(wù)團(tuán)隊(duì)的專業(yè)化能力有著嚴(yán)格要求。

以智能客服業(yè)務(wù)場(chǎng)景為例,當(dāng)客服詢問用戶是否購(gòu)買此商品時(shí),各種用戶會(huì)給出不同回答:“我要和家人商量一下”;“我會(huì)考慮”;“我現(xiàn)在不方便,你一會(huì)兒再打過來”等等,背后的意圖有很多種,可能是暫不購(gòu)買,暫不考慮,拒絕購(gòu)買或者興趣較大。那么,NLP數(shù)據(jù)標(biāo)注就需要對(duì)這些對(duì)話背后的意圖進(jìn)行標(biāo)注和分類。

在云測(cè)數(shù)據(jù),以智能客服單個(gè)場(chǎng)景的意圖標(biāo)注,就分為10-20個(gè)大類,上百個(gè)子類,根據(jù)業(yè)務(wù)需求可能還會(huì)有進(jìn)一步的標(biāo)注細(xì)分。

除了對(duì)NLP數(shù)據(jù)進(jìn)行對(duì)話意圖、領(lǐng)域、槽位等進(jìn)行判斷和標(biāo)注,多角度的泛化也必不可少。也就是說,無論用戶說的是地方話還是普通話,有沒有出現(xiàn)口誤,還是以不同的句子表達(dá)同一個(gè)意思,AI都能夠讀懂句子并給出正確的回答,這就要求NLP數(shù)據(jù)標(biāo)注員對(duì)句子進(jìn)行泛化,以不同的描述方式重組或擴(kuò)充句式、標(biāo)簽等,以提升AI對(duì)話的準(zhǔn)確度。

值得注意的是,相比圖像、視頻等數(shù)據(jù)類型,NLP數(shù)據(jù)采標(biāo)方式更為復(fù)雜。據(jù)云測(cè)數(shù)據(jù)總經(jīng)理賈宇航介紹,圖像采標(biāo)有很強(qiáng)的規(guī)則性,按照規(guī)范化的指導(dǎo)文檔工作即可。

但NLP數(shù)據(jù)對(duì)應(yīng)的是語言的豐富性,需要結(jié)合上下文等背景去理解和處理,客戶給出的需求文檔只是讓數(shù)據(jù)服務(wù)人員能夠理解,這件事情背后的目標(biāo)和意義是什么。在這一過程中需要數(shù)據(jù)服務(wù)人員對(duì)需求進(jìn)行拆解、預(yù)判甚至提前給出建議,與客戶反復(fù)溝通確認(rèn)達(dá)成一致后,才能真正地去作業(yè)。

這對(duì)于數(shù)據(jù)服務(wù)人員的專業(yè)化能力、對(duì)業(yè)務(wù)場(chǎng)景的還原能力、作業(yè)協(xié)同能力,都有很高的要求。尤其在醫(yī)療、法律、教育、智能駕駛等高度專業(yè)化的領(lǐng)域中,標(biāo)注人員并不是隨便找一個(gè)普通人員就可以做,標(biāo)注人員需要非常專業(yè),才能進(jìn)行正確的數(shù)據(jù)標(biāo)注與解讀。

為了保證整個(gè)數(shù)據(jù)團(tuán)隊(duì)的專業(yè)能力,云測(cè)數(shù)據(jù)在人才的選拔、培訓(xùn)、考核、晉升上有著完善的機(jī)制,也對(duì)保證數(shù)據(jù)保質(zhì)量產(chǎn)出有著十分積極的促進(jìn)作用。

再次,在技術(shù)層面,云測(cè)數(shù)據(jù)對(duì)軟硬件設(shè)施的持續(xù)投入,直接拉高了行業(yè)的進(jìn)入門檻。

云測(cè)數(shù)據(jù)自研的數(shù)據(jù)標(biāo)注平臺(tái)會(huì)根據(jù)實(shí)際使用中的反饋,以每周甚至更快的頻率進(jìn)行功能迭代,以技術(shù)結(jié)合更多的落地場(chǎng)景,不斷提升數(shù)據(jù)標(biāo)注工具的技術(shù)含量。同時(shí),云測(cè)數(shù)據(jù)也致力于通過工程化開發(fā)來減輕數(shù)據(jù)標(biāo)注中的重復(fù)勞動(dòng),提升業(yè)務(wù)效率。

最后,在企業(yè)客戶最為看重的數(shù)據(jù)安全和隱私方面,云測(cè)數(shù)據(jù)也有自己的原則和技術(shù)保障。

第一,數(shù)據(jù)絕不復(fù)用,是云測(cè)數(shù)據(jù)的核心原則。對(duì)于客戶定制的數(shù)據(jù)需求,交付后全部清刪,云測(cè)數(shù)據(jù)既不會(huì)自己留底,也不會(huì)把定制數(shù)據(jù)復(fù)制給其他客戶,可以說云測(cè)數(shù)據(jù)一直在花大力氣樹立數(shù)據(jù)安全和隱私的標(biāo)桿,以負(fù)責(zé)的態(tài)度來服務(wù)客戶。

在賈宇航看來,讓企業(yè)擁有數(shù)據(jù)會(huì)成為企業(yè)核心的競(jìng)爭(zhēng)壁壘,客戶找到云測(cè)數(shù)據(jù)合作,一方面是信任,另一方面也是云測(cè)數(shù)據(jù)能夠幫助客戶獲得相應(yīng)的競(jìng)爭(zhēng)性。

第二,為了保證絕對(duì)的數(shù)據(jù)安全,云測(cè)數(shù)據(jù)與所有數(shù)據(jù)采集的用戶都簽訂數(shù)據(jù)授權(quán)協(xié)議,保證企業(yè)用于訓(xùn)練的數(shù)據(jù)合法合規(guī)。同時(shí),云測(cè)數(shù)據(jù)內(nèi)部還設(shè)定了數(shù)據(jù)隔離、質(zhì)量保障等一系列數(shù)據(jù)安全流程和技術(shù)。

在數(shù)據(jù)服務(wù)市場(chǎng),數(shù)據(jù)質(zhì)量是硬指標(biāo),企業(yè)客戶會(huì)通過人工校驗(yàn)、算法檢驗(yàn)等多種方式去驗(yàn)證數(shù)據(jù)采標(biāo)的合格率和通過率。經(jīng)得起市場(chǎng)考驗(yàn),才有活下去的機(jī)會(huì)。

按賈宇航的話說,“我們以企業(yè)服務(wù)的方式,為標(biāo)注的精準(zhǔn)度負(fù)責(zé)”。

在云測(cè)數(shù)據(jù)服務(wù)的數(shù)百家企業(yè)中,既有各大頭部AI企業(yè),也有各個(gè)行業(yè)的龍頭企業(yè)。這些企業(yè)在追求更高的AI認(rèn)知智能準(zhǔn)確度的過程中,合作過各種各樣的數(shù)據(jù)服務(wù)商,最終找到了數(shù)據(jù)標(biāo)注質(zhì)量非常高的云測(cè)數(shù)據(jù),并保持著長(zhǎng)期良好的合作。

事實(shí)上,除了數(shù)據(jù)采標(biāo)的質(zhì)量和安全,數(shù)據(jù)服務(wù)商的全品類服務(wù)能力,以及獨(dú)立第三方的身份,也是企業(yè)進(jìn)行AI合作所考量的重要因素。像云測(cè)數(shù)據(jù)這樣的服務(wù)商,不做算法,不涉及客戶業(yè)務(wù),只提供專業(yè)的數(shù)據(jù)服務(wù),讓企業(yè)客戶在合作時(shí)倍感放心。

從某種程度上說,如此苛刻的要求,也進(jìn)一步導(dǎo)致了頂尖數(shù)據(jù)服務(wù)商的稀缺。

高標(biāo)準(zhǔn)數(shù)據(jù)服務(wù)處于爆發(fā)前夜

頭部服務(wù)商主導(dǎo)市場(chǎng)

如今,AI產(chǎn)業(yè)在政策紅利和藍(lán)海市場(chǎng)的雙重利好中迎來快速發(fā)展,其中NLP市場(chǎng)發(fā)展也進(jìn)入了快車道。

據(jù)《中國(guó)人工智能發(fā)展報(bào)告2018》顯示,2017年中國(guó)人工智能智能市場(chǎng)規(guī)模高達(dá)237億元,其中自然語言處理市場(chǎng)49.77億元,占比21%。預(yù)計(jì)到2020年,中國(guó)在人工智能的市場(chǎng)規(guī)模將接近500億元,自然語言處理領(lǐng)域也將是一個(gè)百億級(jí)的市場(chǎng)。

不難預(yù)料,為自然語言處理市場(chǎng)提供“養(yǎng)料”的NLP數(shù)據(jù)服務(wù),同樣處于爆發(fā)前夜。目前,自然語言處理已經(jīng)有了許多商業(yè)化應(yīng)用,如:機(jī)器翻譯、輿情監(jiān)測(cè)、自動(dòng)摘要、問答機(jī)器人、客服機(jī)器人、電銷機(jī)器人、智能推薦等,在龐大的市場(chǎng)規(guī)模和市場(chǎng)需求下,高質(zhì)量的NLP數(shù)據(jù)服務(wù)也將成為AI商業(yè)化發(fā)展的必然趨勢(shì)。

值得注意的是,雖然高質(zhì)量NLP數(shù)據(jù)需求爆棚,但是在市場(chǎng)上,像云測(cè)數(shù)據(jù)這類優(yōu)質(zhì)數(shù)據(jù)服務(wù)商會(huì)持續(xù)稀缺,供需不平衡很難在短期內(nèi)解決。

從供給側(cè)看,高質(zhì)量業(yè)務(wù)的競(jìng)爭(zhēng)壁壘很高,由高素質(zhì)人才、專業(yè)化流程和方法論構(gòu)建出的軟實(shí)力,很難在短期內(nèi)實(shí)現(xiàn)超越。看似業(yè)務(wù)模式很重的模式,實(shí)際上給擅長(zhǎng)“輕裝上陣”、以平臺(tái)效應(yīng)進(jìn)入賽道的互聯(lián)網(wǎng)巨頭們,設(shè)下了短期內(nèi)無法逾越的鴻溝。正如經(jīng)緯的創(chuàng)始合伙人張穎所說:“所有輕公司以后都會(huì)做重,只有做重才能有效抗拒巨頭殺入,也唯有如此才能做大?!?/p>

從需求側(cè)看,一方面,AI商業(yè)化對(duì)NLP數(shù)據(jù)的要求還在繼續(xù)提高,數(shù)據(jù)服務(wù)的業(yè)務(wù)操作會(huì)越來越復(fù)雜,無論是在數(shù)據(jù)采集的樣本多樣性、場(chǎng)景多樣性方面,還是在數(shù)據(jù)標(biāo)注的數(shù)據(jù)精度、領(lǐng)域知識(shí)方面,數(shù)據(jù)服務(wù)商都面臨不斷升級(jí)的業(yè)務(wù)難度。對(duì)于后進(jìn)者而言,沒有專業(yè)知識(shí)、技術(shù)和行業(yè)經(jīng)驗(yàn)的日復(fù)一日的積累,這種競(jìng)爭(zhēng)差距只會(huì)越拉越大。

另一方面,由于AI算法需要源源不斷地輸入高質(zhì)量的標(biāo)注數(shù)據(jù),好的數(shù)據(jù)服務(wù)業(yè)務(wù)粘性很高,以云測(cè)數(shù)據(jù)為例,一個(gè)項(xiàng)目在建立合作之后,往往會(huì)帶來長(zhǎng)達(dá)2-3年的持續(xù)合作,這就產(chǎn)生了馬太效應(yīng),強(qiáng)者恒強(qiáng)。

從供需雙方合作的現(xiàn)狀看,高質(zhì)量、定制化數(shù)據(jù)服務(wù)是一個(gè)新興領(lǐng)域,供需雙方的合作模式還在升級(jí)和探索中。曾經(jīng)習(xí)慣大包大攬、自建數(shù)據(jù)采標(biāo)團(tuán)隊(duì)的企業(yè),如今也在逐漸轉(zhuǎn)向?qū)で髮I(yè)的數(shù)據(jù)服務(wù)商合作。

在這一過程中,供需雙方會(huì)出現(xiàn)更加明確的分工,也會(huì)在市場(chǎng)競(jìng)爭(zhēng)的淘洗中,沉淀出最為優(yōu)質(zhì)的服務(wù)商。而這種合作模式的探索,最先會(huì)從各行業(yè)的頭部企業(yè)和頭部服務(wù)商開始,逐漸在眾多中小型企業(yè)中形成“示范效應(yīng)”。

“沒有好的數(shù)據(jù),人工智能就沒有未來”,這句話已經(jīng)成為業(yè)界共識(shí)。在巨大的AI商業(yè)化需求下,高質(zhì)量的數(shù)據(jù)已成為AI業(yè)務(wù)競(jìng)爭(zhēng)的關(guān)鍵,由此誕生的數(shù)據(jù)服務(wù)也將是未來最重要的趨勢(shì)之一??梢灶A(yù)見,高標(biāo)準(zhǔn)數(shù)據(jù)服務(wù)這一新興市場(chǎng)亟待爆發(fā),從長(zhǎng)期看必將經(jīng)歷從荒蕪到繁榮、從亂象到規(guī)范的發(fā)展過程,繼而承載著AI技術(shù)進(jìn)入更加智能的下一階段。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122806
  • 聊天機(jī)器人
    +關(guān)注

    關(guān)注

    0

    文章

    348

    瀏覽量

    12803
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    490

    瀏覽量

    22629

原文標(biāo)題:【格物·分享】AI商業(yè)化之爭(zhēng):高質(zhì)量NLP數(shù)據(jù)成“搶手貨”

文章出處:【微信號(hào):GeWu-IOT,微信公眾號(hào):物聯(lián)網(wǎng)資本論】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    高標(biāo)準(zhǔn)農(nóng)田中的智慧閘門物聯(lián)網(wǎng)系統(tǒng)方案

    建設(shè)高標(biāo)準(zhǔn)農(nóng)田是鞏固提高糧食生產(chǎn)能力、保障國(guó)家糧食安全的重要舉措,也是實(shí)現(xiàn)農(nóng)業(yè)科技現(xiàn)代化的關(guān)鍵所在。當(dāng)前,隨著新一輪科技革命和產(chǎn)業(yè)變革興起,無線通信、物聯(lián)網(wǎng)、大數(shù)據(jù)等信息化技術(shù)迅猛發(fā)展,為高標(biāo)準(zhǔn)農(nóng)田的高質(zhì)量發(fā)展提供可靠幫助。
    的頭像 發(fā)表于 07-05 11:03 ?199次閱讀

    PLC遠(yuǎn)程控制網(wǎng)關(guān)在高標(biāo)準(zhǔn)農(nóng)田灌區(qū)中的智能化節(jié)水應(yīng)用

    一、項(xiàng)目背景 隨著農(nóng)業(yè)現(xiàn)代化的推進(jìn),高標(biāo)準(zhǔn)農(nóng)田建設(shè)成為提升農(nóng)業(yè)生產(chǎn)效率和質(zhì)量的重要舉措。在某大型高標(biāo)準(zhǔn)農(nóng)田灌區(qū)項(xiàng)目中,為實(shí)現(xiàn)灌區(qū)的高效管理和精準(zhǔn)灌溉,引入了先進(jìn)的信息化技術(shù)。該項(xiàng)目采用了遠(yuǎn)創(chuàng)
    的頭像 發(fā)表于 06-06 14:31 ?194次閱讀
    PLC遠(yuǎn)程控制網(wǎng)關(guān)在<b class='flag-5'>高標(biāo)準(zhǔn)</b>農(nóng)田灌區(qū)中的智能化節(jié)水應(yīng)用

    安徽省蕪湖市智慧農(nóng)業(yè)新風(fēng)貌,數(shù)字化引領(lǐng)高標(biāo)準(zhǔn)農(nóng)田建設(shè)

    號(hào)召,推動(dòng)農(nóng)業(yè)現(xiàn)代化發(fā)展。通過引入物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等數(shù)字化技術(shù),蕪湖市在5000余畝高標(biāo)準(zhǔn)農(nóng)田中實(shí)現(xiàn)了智能化管理,打造了“耕、種、管、收”全程少人化的現(xiàn)代農(nóng)業(yè)模式。 漫途高標(biāo)準(zhǔn)農(nóng)田建設(shè)數(shù)字化解決方案 在農(nóng)業(yè)現(xiàn)代化與數(shù)字化
    的頭像 發(fā)表于 02-28 11:09 ?438次閱讀
    安徽省蕪湖市智慧農(nóng)業(yè)新風(fēng)貌,數(shù)字化引領(lǐng)<b class='flag-5'>高標(biāo)準(zhǔn)</b>農(nóng)田建設(shè)

    智慧灌溉,科技助農(nóng),漫途高標(biāo)準(zhǔn)農(nóng)田數(shù)字化方案

    政策背景近年來,國(guó)家高度重視高標(biāo)準(zhǔn)農(nóng)田建設(shè),出臺(tái)了一系列政策文件以推動(dòng)農(nóng)業(yè)現(xiàn)代化進(jìn)程。2019年,國(guó)務(wù)院辦公廳明確提出到2022年全國(guó)建成10億畝高標(biāo)準(zhǔn)農(nóng)田的目標(biāo);2021年,農(nóng)業(yè)農(nóng)村部進(jìn)一步規(guī)劃
    的頭像 發(fā)表于 01-03 13:45 ?457次閱讀
    智慧灌溉,科技助農(nóng),漫途<b class='flag-5'>高標(biāo)準(zhǔn)</b>農(nóng)田數(shù)字化方案

    智慧灌溉,科技助農(nóng),漫途高標(biāo)準(zhǔn)農(nóng)田數(shù)字化方案

    ,至2025年建成高標(biāo)準(zhǔn)農(nóng)田10.75億畝,并改造提升現(xiàn)有高標(biāo)準(zhǔn)農(nóng)田1.05億畝,至2030年目標(biāo)達(dá)12億畝。 2022年中央一號(hào)文件更是強(qiáng)調(diào)了智慧農(nóng)業(yè)的發(fā)展,要求建立農(nóng)業(yè)農(nóng)村大數(shù)據(jù)體系,推動(dòng)信息技術(shù)與農(nóng)業(yè)生產(chǎn)經(jīng)營(yíng)深度融合,完善
    的頭像 發(fā)表于 01-02 15:54 ?389次閱讀
    智慧灌溉,科技助農(nóng),漫途<b class='flag-5'>高標(biāo)準(zhǔn)</b>農(nóng)田數(shù)字化方案

    高標(biāo)準(zhǔn)農(nóng)田氣象監(jiān)測(cè)物聯(lián)網(wǎng)系統(tǒng)方案

    信息化、系統(tǒng)性管理,為農(nóng)田管理提供高效可靠的工作支持。 通過在各個(gè)高標(biāo)準(zhǔn)農(nóng)田部署氣象監(jiān)測(cè)站,實(shí)現(xiàn)溫濕度傳感器、光照傳感器、墑情傳感器等設(shè)備數(shù)據(jù)采集,從而在智慧農(nóng)田管理平臺(tái)實(shí)現(xiàn)可視化展示,異常告警、集中管理等功
    的頭像 發(fā)表于 12-18 14:21 ?381次閱讀

    數(shù)字農(nóng)業(yè)時(shí)代高標(biāo)準(zhǔn)農(nóng)田信息化的創(chuàng)新實(shí)踐

    感知與大數(shù)據(jù)分析 高標(biāo)準(zhǔn)農(nóng)田信息化的核心,在于將物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算、人工智能等現(xiàn)代信息技術(shù)深度融合到農(nóng)業(yè)生產(chǎn)管理中。通過部署各類傳感器,如土壤濕度傳感器、氣象站、作物生長(zhǎng)監(jiān)測(cè)攝像頭等,實(shí)現(xiàn)對(duì)農(nóng)田環(huán)境的實(shí)時(shí)監(jiān)
    的頭像 發(fā)表于 10-16 16:51 ?614次閱讀
    數(shù)字農(nóng)業(yè)<b class='flag-5'>時(shí)代</b>:<b class='flag-5'>高標(biāo)準(zhǔn)</b>農(nóng)田信息化的創(chuàng)新實(shí)踐

    高標(biāo)準(zhǔn)農(nóng)田信息化與物聯(lián)網(wǎng)技術(shù)的融合

    在新時(shí)代農(nóng)業(yè)轉(zhuǎn)型的大背景下,高標(biāo)準(zhǔn)農(nóng)田建設(shè)不僅是提升農(nóng)業(yè)生產(chǎn)效率、保障糧食安全的關(guān)鍵舉措,也是推動(dòng)農(nóng)業(yè)現(xiàn)代化的重要途徑。其中,信息化與物聯(lián)網(wǎng)技術(shù)的深度融合,為高標(biāo)準(zhǔn)農(nóng)田的發(fā)展注入了新的活力,開啟了
    的頭像 發(fā)表于 10-15 16:50 ?635次閱讀
    <b class='flag-5'>高標(biāo)準(zhǔn)</b>農(nóng)田信息化與物聯(lián)網(wǎng)技術(shù)的融合

    推動(dòng)農(nóng)業(yè)4.0高標(biāo)準(zhǔn)農(nóng)田灌區(qū)信息化的關(guān)鍵作用

    農(nóng)業(yè)4.0,作為現(xiàn)代農(nóng)業(yè)發(fā)展的新階段,深度融合了物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等先進(jìn)技術(shù),旨在實(shí)現(xiàn)農(nóng)業(yè)生產(chǎn)精準(zhǔn)化、智能化與可持續(xù)化。在這場(chǎng)農(nóng)業(yè)革命中,高標(biāo)準(zhǔn)農(nóng)田灌區(qū)的信息化建設(shè)扮演著至關(guān)重要的角色,它不
    的頭像 發(fā)表于 10-14 16:43 ?648次閱讀
    推動(dòng)農(nóng)業(yè)<b class='flag-5'>4.0</b>:<b class='flag-5'>高標(biāo)準(zhǔn)</b>農(nóng)田灌區(qū)信息化的關(guān)鍵作用

    智慧農(nóng)田新篇章:高標(biāo)準(zhǔn)農(nóng)田灌區(qū)信息化的創(chuàng)新實(shí)踐

    在新時(shí)代的農(nóng)業(yè)發(fā)展藍(lán)圖中,智慧農(nóng)田已成為推動(dòng)農(nóng)業(yè)現(xiàn)代化、實(shí)現(xiàn)可持續(xù)發(fā)展目標(biāo)的關(guān)鍵一環(huán)。高標(biāo)準(zhǔn)農(nóng)田灌區(qū)信息化作為智慧農(nóng)業(yè)的重要組成部分,正引領(lǐng)著一場(chǎng)深刻的農(nóng)業(yè)技術(shù)革命,它不僅關(guān)乎糧食安全與資源高效利用
    的頭像 發(fā)表于 10-11 17:23 ?681次閱讀
    智慧農(nóng)田新篇章:<b class='flag-5'>高標(biāo)準(zhǔn)</b>農(nóng)田灌區(qū)信息化的創(chuàng)新實(shí)踐

    高標(biāo)準(zhǔn)農(nóng)田灌區(qū)信息化:為農(nóng)業(yè)可持續(xù)發(fā)展注入新動(dòng)力

    高標(biāo)準(zhǔn)農(nóng)田灌區(qū)信息化,作為現(xiàn)代農(nóng)業(yè)科技與信息技術(shù)深度融合的典范,正逐步成為推動(dòng)農(nóng)業(yè)可持續(xù)發(fā)展的關(guān)鍵力量。這一創(chuàng)新模式不僅提升了農(nóng)業(yè)生產(chǎn)效率與資源利用率,還為保障國(guó)家糧食安全、促進(jìn)農(nóng)村經(jīng)濟(jì)轉(zhuǎn)型升級(jí)以及
    的頭像 發(fā)表于 09-30 17:21 ?592次閱讀
    <b class='flag-5'>高標(biāo)準(zhǔn)</b>農(nóng)田灌區(qū)信息化:為農(nóng)業(yè)可持續(xù)發(fā)展注入新動(dòng)力

    智慧農(nóng)業(yè)的引擎:高標(biāo)準(zhǔn)農(nóng)田灌區(qū)信息化的探索與實(shí)踐

    農(nóng)田灌區(qū)信息化的內(nèi)涵 高標(biāo)準(zhǔn)農(nóng)田灌區(qū)信息化,簡(jiǎn)而言之,是將現(xiàn)代信息技術(shù)深度融合于農(nóng)田灌溉管理系統(tǒng)之中,包括物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算、人工智能等先進(jìn)技術(shù)的應(yīng)用,以實(shí)現(xiàn)對(duì)農(nóng)田灌溉的精準(zhǔn)管理、智能決策與高效運(yùn)行。這一
    的頭像 發(fā)表于 09-24 10:24 ?576次閱讀
    智慧農(nóng)業(yè)的引擎:<b class='flag-5'>高標(biāo)準(zhǔn)</b>農(nóng)田灌區(qū)信息化的探索與實(shí)踐

    信息化時(shí)代下的高標(biāo)準(zhǔn)農(nóng)田灌區(qū):變革與機(jī)遇并存

    在信息化時(shí)代的浪潮中,高標(biāo)準(zhǔn)農(nóng)田灌區(qū)的建設(shè)與管理正經(jīng)歷著前所未有的變革,這既是一個(gè)挑戰(zhàn)重重的歷程,也孕育著無限的發(fā)展機(jī)遇。隨著物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算以及人工智能等先進(jìn)技術(shù)的飛速發(fā)展與融合應(yīng)用,傳統(tǒng)
    的頭像 發(fā)表于 09-20 16:01 ?458次閱讀
    信息化<b class='flag-5'>時(shí)代</b>下的<b class='flag-5'>高標(biāo)準(zhǔn)</b>農(nóng)田灌區(qū):變革與機(jī)遇并存

    寧德時(shí)代:動(dòng)力電池行業(yè)應(yīng)步入高標(biāo)準(zhǔn)發(fā)展新階段

    9月2日下午,全球矚目的世界動(dòng)力電池大會(huì)上,寧德時(shí)代領(lǐng)航人曾毓群發(fā)表了一場(chǎng)深刻的主旨演講,明確指出了動(dòng)力電池產(chǎn)業(yè)邁向“高標(biāo)準(zhǔn)時(shí)代的迫切需求,并圍繞高安全、高可靠、高性能、高價(jià)值四大核心議題,提出了前瞻性的見解與建議。
    的頭像 發(fā)表于 09-03 16:52 ?891次閱讀

    高標(biāo)準(zhǔn)農(nóng)田灌區(qū)對(duì)農(nóng)業(yè)發(fā)展的支撐作用

    。 首先,水資源管理的角度看,高標(biāo)準(zhǔn)農(nóng)田灌區(qū)通過先進(jìn)的灌溉技術(shù)和智能化管理系統(tǒng),實(shí)現(xiàn)了對(duì)水資源的精準(zhǔn)控制和高效利用。通過在灌區(qū)部署的大量傳感器,如土壤濕度傳感器、氣象監(jiān)測(cè)站、水位傳感器等,系統(tǒng)能夠?qū)崟r(shí)監(jiān)測(cè)和收
    的頭像 發(fā)表于 08-26 17:45 ?881次閱讀
    <b class='flag-5'>高標(biāo)準(zhǔn)</b>農(nóng)田灌區(qū)對(duì)農(nóng)業(yè)發(fā)展的支撐作用