99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

垂直大模型競(jìng)爭(zhēng),能突破數(shù)據(jù)“卡點(diǎn)”嗎?

科技云報(bào)到 ? 來源:jf_60444065 ? 作者:jf_60444065 ? 2023-05-19 14:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

科技云報(bào)道原創(chuàng)。

AI大模型火遍全球,中國產(chǎn)業(yè)也激發(fā)了對(duì)人工智能應(yīng)用的新熱情。

隨著各大廠商參與競(jìng)逐,市場(chǎng)正在分化為通用與垂直兩大路徑,兩者在參數(shù)級(jí)別、應(yīng)用場(chǎng)景、商業(yè)模式等方面差異已逐步顯現(xiàn)。

企業(yè)涌入垂直大模型賽道

通用AI大模型像ChatGPT,能夠處理各種領(lǐng)域和場(chǎng)景的自然語言,但由于需要巨大的計(jì)算資源和數(shù)據(jù)量,已經(jīng)成為國內(nèi)外大廠的重點(diǎn)項(xiàng)目。

這類企業(yè)往往有著強(qiáng)大的技術(shù)團(tuán)隊(duì)和資金支持,且有著自己的場(chǎng)景和流量?jī)?yōu)勢(shì)。比如百度、阿里、騰訊、字節(jié)、華為等,在搜索、社交、電商、辦公等領(lǐng)域都有著自己的通用AI大模型。

相較之下,創(chuàng)業(yè)公司、細(xì)分領(lǐng)域企業(yè)很難在這樣的競(jìng)爭(zhēng)中獲得先發(fā)優(yōu)勢(shì)或者差異化優(yōu)勢(shì)。

而垂直AI大模型只關(guān)注某個(gè)特定的領(lǐng)域或者場(chǎng)景,它能夠利用行業(yè)的數(shù)據(jù)和知識(shí),提供更精準(zhǔn)和高效的解決方案,更好地滿足用戶在某個(gè)領(lǐng)域或者場(chǎng)景下的需求和期待,如:醫(yī)療、金融、教育等。

同時(shí),它可以利用一些開源或者閉源的通用AI大模型作為基礎(chǔ),然后在其上進(jìn)行指令微調(diào)(instruction tuning),來適應(yīng)自己的目標(biāo)領(lǐng)域或者場(chǎng)景。

因此,它的參數(shù)規(guī)模比通用大模型低一個(gè)量級(jí),如果讓數(shù)據(jù)飛輪和模型訓(xùn)練能夠很好結(jié)合,在某些特定領(lǐng)域甚至比通用大模型的效果更好、成本更低。

在這樣的背景下,越來越多的企業(yè)加入了垂直大模型的賽道。

5月18日,深信服發(fā)布國內(nèi)首個(gè)自研安全大模型,成為安全領(lǐng)域GPT技術(shù)應(yīng)用首秀;

5月5日,學(xué)而思宣布正在進(jìn)行自研數(shù)學(xué)大模型的研發(fā),命名為MathGPT,面向全球數(shù)學(xué)愛好者和科研機(jī)構(gòu);

3月,達(dá)觀數(shù)據(jù)公布正在開發(fā)曹植系統(tǒng),專注于金融、政務(wù)、制造等垂直領(lǐng)域的大語言模型。

明確的商業(yè)化落地場(chǎng)景和更低的算力成本,為各類企業(yè)打開了進(jìn)軍垂直大模型的大門。

垂直大模型的考驗(yàn)

垂直大模型的優(yōu)勢(shì)在于不夠大:算力不夠大、算法難度低,但并不代表垂直大模型誰都能做。

眾所周知,AI大模型三要素:算力、算法、數(shù)據(jù),都是喂養(yǎng)AI的“飼料”。

先說算力。

大模型之所以“大”,就是因?yàn)閰?shù)眾多和數(shù)據(jù)量龐大。AI大模型所需要的計(jì)算量,大致上相當(dāng)于參數(shù)量與數(shù)據(jù)量的乘積。

過去5年,AI大模型的參數(shù)量幾乎每年提升一個(gè)數(shù)量級(jí),例如GPT-4參數(shù)量是GPT-3的16倍,達(dá)到1.6萬億個(gè)。

隨著圖像、音視頻等多模態(tài)數(shù)據(jù)的引入,大模型的數(shù)據(jù)量也在飛速膨脹。這意味著想要玩轉(zhuǎn)大模型,必須擁有大算力。

而一套垂直大模型的訓(xùn)練和推理成本,做個(gè)參考,在數(shù)字人垂類技術(shù)場(chǎng)景中,可以做到比Open AI同參數(shù)規(guī)模的模型低一個(gè)量級(jí),像啟元世界的戰(zhàn)略總監(jiān)王思捷就曾提到:先構(gòu)建更小的垂類模型(比如百億參數(shù)、十億參數(shù)),讓數(shù)據(jù)飛輪和模型訓(xùn)練能夠很好結(jié)合,垂類模型在某些領(lǐng)域可能比Open AI的效果更好成本更低。

即便垂直大模型在算力要求上已遠(yuǎn)遠(yuǎn)低于通用大模型,但對(duì)算力基礎(chǔ)設(shè)施的投入依然會(huì)阻擋部分小公司的入局。

再說算法。

在三要素中,算法的研發(fā)難度相對(duì)較低,每家公司都有自己實(shí)現(xiàn)大模型的路徑算法,且有眾多開源項(xiàng)目可作為參考,中國公司最容易縮短甚至抹平差距。

最后說數(shù)據(jù)。

高質(zhì)量的數(shù)據(jù)是助力AI訓(xùn)練與調(diào)優(yōu)的關(guān)鍵,足夠多、足夠豐富的數(shù)據(jù),是AI大模型的根基。

OpenAI此前披露,為了AI像人類那樣流暢交談,研發(fā)人員給GPT-3.5提供多達(dá)45TB的文本語料,相當(dāng)于472萬套中國“四大名著”。這些語料的來源包括維基百科、網(wǎng)絡(luò)文章、書籍期刊等,甚至還將代碼開源平臺(tái)Github納入其中。

但是聚焦到細(xì)分行業(yè),數(shù)據(jù)的獲取就沒那么容易了。

興業(yè)證券公開表示,要訓(xùn)練專業(yè)的行業(yè)大模型,優(yōu)質(zhì)的行業(yè)數(shù)據(jù)、公共數(shù)據(jù)至關(guān)重要。

就國內(nèi)數(shù)據(jù)市場(chǎng)而言,據(jù)發(fā)改委官方批露,我國政府?dāng)?shù)據(jù)資源占全國數(shù)據(jù)資源的比重超過3/4,但開放規(guī)模不足美國的10%,個(gè)人和企業(yè)可以利用的規(guī)模更是不及美國的7%。

而行業(yè)數(shù)據(jù)更是非常核心的私域數(shù)據(jù),私域數(shù)據(jù)量越大,質(zhì)量越高,就越有價(jià)值。

比如,一個(gè)醫(yī)療公司擁有大量醫(yī)療數(shù)據(jù)、病例數(shù)據(jù),那么它就能開發(fā)出醫(yī)療垂直大模型類的產(chǎn)品。同理,建筑行業(yè)的項(xiàng)目數(shù)據(jù)、金融行業(yè)的用戶畫像數(shù)據(jù)、海運(yùn)行業(yè)的船位數(shù)據(jù)等,都是賦能垂直大模型的關(guān)鍵。

但是這些私域數(shù)據(jù)都攥在企業(yè)自己手中,而且為了數(shù)據(jù)安全和合規(guī),絕大部分機(jī)構(gòu)是要本地化部署才會(huì)嘗試大模型訓(xùn)練,很難想象企業(yè)會(huì)把自己的核心數(shù)據(jù)拿給別人去訓(xùn)練。

此外,如何合理地給數(shù)據(jù)打上分級(jí)標(biāo)簽、做好標(biāo)注也非常重要。數(shù)據(jù)分級(jí)分類能夠幫助產(chǎn)品提效,而高精度的標(biāo)注數(shù)據(jù)能夠進(jìn)一步提升大模型的專業(yè)表現(xiàn)。

但現(xiàn)階段垂直行業(yè)想要獲取高精度標(biāo)注數(shù)據(jù)的成本較高,而在公開數(shù)據(jù)庫中,行業(yè)專業(yè)數(shù)據(jù)也較少,因此對(duì)垂直大模型的建構(gòu)提出了很高的要求。

總體而言,想要做好垂直大模型,數(shù)據(jù)的重要性,遠(yuǎn)超過算力和算法。

數(shù)據(jù),已成為企業(yè)突破垂直大模型的“卡點(diǎn)”。

手握行業(yè)數(shù)據(jù)領(lǐng)先一步

垂類大模型講求應(yīng)用與場(chǎng)景先行的邏輯,而在國內(nèi)更是強(qiáng)調(diào)產(chǎn)業(yè)側(cè)的價(jià)值。

一方面,在當(dāng)前中國的智能化浪潮下,產(chǎn)業(yè)側(cè)數(shù)字化革新本就有廣闊的市場(chǎng)需求;另一方面,在toB生態(tài)下,基于垂直應(yīng)用的實(shí)踐也有利于形成數(shù)據(jù)飛輪與場(chǎng)景飛輪。

而這一切的前提,是推出垂類大模型的公司在該行業(yè)已建立技術(shù)壁壘與護(hù)城河,即“人無我有”的競(jìng)爭(zhēng)優(yōu)勢(shì)。

如此看來,在垂直行業(yè)深耕多年的企業(yè)或?qū)⒂懈蟮内A面。

這類企業(yè)在數(shù)據(jù)層面、大模型以及知識(shí)圖譜方面都有較為深厚的積累,對(duì)于大模型的優(yōu)化更具優(yōu)勢(shì)。同時(shí),它們對(duì)于to B客戶需求和落地場(chǎng)景有很深的理解,能夠更好地保證垂直大模型產(chǎn)品的可信和可靠,滿足企業(yè)級(jí)對(duì)于安全可控合規(guī)的需求。

目前,已有一些垂類大模型在金融、教育、醫(yī)藥、營銷等場(chǎng)景中得到試煉。

例如,彭博社利用自身豐富的金融數(shù)據(jù)源,基于開源的GPT-3框架再訓(xùn)練,開發(fā)出了金融專屬大模型BloombergGPT;

網(wǎng)易有道則面向教育場(chǎng)景,推出自研的類ChatGPT模型“子曰”;

在ChatGPT發(fā)布后僅幾周,谷歌公布了一個(gè)專門用于回答醫(yī)療保健相關(guān)問題的大型醫(yī)用語言模型Med-PaLM......

相信隨著越來越多企業(yè)入局,垂直大模型在各個(gè)行業(yè)和細(xì)分領(lǐng)域中將大量涌現(xiàn)。而那些能將一個(gè)垂直領(lǐng)域做專、做透,用高質(zhì)量的數(shù)據(jù)持續(xù)優(yōu)化模型,跑通商業(yè)閉環(huán),構(gòu)建起產(chǎn)業(yè)生態(tài)的企業(yè),最終將把價(jià)值鏈做到足夠長(zhǎng)。

【關(guān)于科技云報(bào)道】

專注于原創(chuàng)的企業(yè)級(jí)內(nèi)容行家——科技云報(bào)道。成立于2015年,是前沿企業(yè)級(jí)IT領(lǐng)域Top10媒體。獲工信部權(quán)威認(rèn)可,可信云、全球云計(jì)算大會(huì)官方指定傳播媒體之一。深入原創(chuàng)報(bào)道云計(jì)算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領(lǐng)域。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7256

    瀏覽量

    91891
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    280013
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1590

    瀏覽量

    9110
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3146

    瀏覽量

    4074
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    數(shù)據(jù)標(biāo)注與大模型的雙向賦:效率與性能的躍升

    ??在人工智能蓬勃發(fā)展的時(shí)代,大模型憑借其強(qiáng)大的學(xué)習(xí)與泛化能力,已成為眾多領(lǐng)域創(chuàng)新變革的核心驅(qū)動(dòng)力。而數(shù)據(jù)標(biāo)注作為大模型訓(xùn)練的基石,為大模型性能提升注入關(guān)鍵動(dòng)力,是
    的頭像 發(fā)表于 06-04 17:15 ?700次閱讀
    <b class='flag-5'>數(shù)據(jù)</b>標(biāo)注與大<b class='flag-5'>模型</b>的雙向賦<b class='flag-5'>能</b>:效率與性能的躍升

    如何賦醫(yī)療AI大模型應(yīng)用?

    “百模大戰(zhàn)”。不僅如此,這些通用AI大模型還逐漸滲透到各個(gè)垂直行業(yè)中,其中生命科學(xué)和醫(yī)療健康行業(yè)成為了拓展速度較快的一個(gè)領(lǐng)域。從2023年2月至10月初,國內(nèi)市場(chǎng)上
    的頭像 發(fā)表于 05-07 09:36 ?265次閱讀
    如何賦<b class='flag-5'>能</b>醫(yī)療AI大<b class='flag-5'>模型</b>應(yīng)用?

    絕味20歲生日會(huì),鴨廠鵝廠聯(lián)手發(fā)布中國零售連鎖AI垂直場(chǎng)景大模型

    絕味×騰訊,首個(gè)中國零售連鎖AI垂直場(chǎng)景大模型的破殼之路
    的頭像 發(fā)表于 04-23 19:18 ?855次閱讀
    絕味20歲生日會(huì),鴨廠鵝廠聯(lián)手發(fā)布中國零售連鎖AI<b class='flag-5'>垂直</b>場(chǎng)景大<b class='flag-5'>模型</b>

    模型時(shí)代 垂直化是數(shù)據(jù)市場(chǎng)發(fā)展趨勢(shì) 解決單點(diǎn)難題是核心競(jìng)爭(zhēng)

    數(shù)據(jù),作為一種革命性的生產(chǎn)資源,與算力、算法共同構(gòu)成了人工智能產(chǎn)業(yè)的三大要素。受益于人工智能的蓬勃發(fā)展,人類加速進(jìn)入到由數(shù)據(jù)驅(qū)動(dòng)的數(shù)字化時(shí)代,數(shù)據(jù)作為核心要素的作用越來越重要。 01 大模型
    的頭像 發(fā)表于 04-09 11:48 ?170次閱讀

    人民出行首批入選廣西人工智能垂直模型,以科技投入帶領(lǐng)行業(yè)前行

    作為首批入選企業(yè),憑借深度融合時(shí)空?qǐng)D神經(jīng)網(wǎng)絡(luò)、多目標(biāo)優(yōu)化算法、集成視覺傳感器的騎行安全監(jiān)控及能源路由算法等前沿技術(shù)所打造的 “大數(shù)據(jù)監(jiān)控可視化平臺(tái) + APP 端實(shí)時(shí)推薦” 雙引擎系統(tǒng),成功破解共享出行行業(yè)痛點(diǎn),在眾多競(jìng)爭(zhēng)者中脫
    的頭像 發(fā)表于 03-19 09:18 ?435次閱讀

    垂直運(yùn)動(dòng)永磁同步直線電機(jī)的復(fù)合控制研究

    后,系統(tǒng)可以達(dá)到較好的抗干擾效果,基本上消除了響應(yīng)滯后,準(zhǔn)確的跟蹤輸入信號(hào)。文件過大,請(qǐng)點(diǎn)擊下方附件免費(fèi)下載~~~*附件:20250312_垂直運(yùn)動(dòng)永磁同步直線電機(jī)的復(fù)合控制研究.docx
    發(fā)表于 03-12 17:07

    數(shù)據(jù)采集卡:示波器不是萬的?。?!#數(shù)據(jù)采集卡 #示波器 #熱電偶 #信號(hào)

    數(shù)據(jù)采集卡
    西安阿爾泰電子科技發(fā)展有限公司
    發(fā)布于 :2025年03月07日 16:38:13

    熱變形微軟化點(diǎn)測(cè)試儀:材料性能檢測(cè)的關(guān)鍵儀器

    在材料科學(xué)領(lǐng)域,熱變形微軟化點(diǎn)測(cè)試儀發(fā)揮著舉足輕重的作用。它是一種用于精確測(cè)定材料在特定條件下熱變形溫度以及微軟化點(diǎn)的專業(yè)儀器。和晟HS-XRW-300MA熱變形維
    的頭像 發(fā)表于 02-24 13:36 ?456次閱讀
    熱變形微<b class='flag-5'>卡</b>軟化<b class='flag-5'>點(diǎn)</b>測(cè)試儀:材料性能檢測(cè)的關(guān)鍵儀器

    通用大模型垂直行業(yè)的應(yīng)用

    隨著DeepSeek這類通用大模型的普及,接下來會(huì)迎來更加精細(xì)化的垂直行業(yè)模型,那么哪些垂直行業(yè)會(huì)率先受益?以下是DeepSeek的整理預(yù)測(cè),供大家參考。
    的頭像 發(fā)表于 02-10 15:44 ?811次閱讀

    天數(shù)智芯與無問芯穹合作突破集群訓(xùn)練優(yōu)化

    近日,天數(shù)智芯與無問芯穹宣布達(dá)成深度合作,并在千集群訓(xùn)練優(yōu)化領(lǐng)域取得了重大技術(shù)突破。這一合作基于天數(shù)智芯的天垓150卓越計(jì)算能力和無問芯穹自主研發(fā)的大模型訓(xùn)練框架,共同推動(dòng)了LLaMA千
    的頭像 發(fā)表于 01-21 14:31 ?869次閱讀

    科普知識(shí)丨熱變形維軟化點(diǎn)測(cè)試儀是什么?

    軟化點(diǎn)。熱變形溫度是指材料在一定負(fù)荷下,產(chǎn)生規(guī)定變形量時(shí)的溫度;維軟化點(diǎn)則是在規(guī)定的升溫速率下,標(biāo)準(zhǔn)壓針在試樣上壓入規(guī)定深度時(shí)的溫度。通過對(duì)這些參數(shù)的精確測(cè)量,
    的頭像 發(fā)表于 01-08 10:40 ?466次閱讀
    科普知識(shí)丨熱變形維<b class='flag-5'>卡</b>軟化<b class='flag-5'>點(diǎn)</b>測(cè)試儀是什么?

    【「大模型啟示錄」閱讀體驗(yàn)】+開啟智能時(shí)代的新鑰匙

    ,NVDIA與微軟的競(jìng)爭(zhēng) 。計(jì)算能力的飛速提升是大模型得以興起的重要基石。GPU/TPU 等高性能計(jì)算設(shè)備的迅猛發(fā)展,宛如為大模型的訓(xùn)練打造了一臺(tái)強(qiáng)大的引擎。它們能夠以極高的速度處理海量的數(shù)據(jù)
    發(fā)表于 12-24 13:10

    【「大模型啟示錄」閱讀體驗(yàn)】營銷領(lǐng)域大模型的應(yīng)用

    使企業(yè)能夠提前洞察市場(chǎng)動(dòng)向,制定前瞻性的市場(chǎng)策略,從而在競(jìng)爭(zhēng)中占據(jù)有利地位。 通過分析廣告投放的效果數(shù)據(jù),大模型可以幫助企業(yè)優(yōu)化廣告內(nèi)容和投放策略。這包括確定最佳的廣告渠道、投放時(shí)間和目標(biāo)受眾,以及
    發(fā)表于 12-24 12:48

    Kaggle知識(shí)點(diǎn):使用大模型進(jìn)行特征篩選

    方法依賴于數(shù)據(jù)集中的樣本點(diǎn)進(jìn)行統(tǒng)計(jì)推斷,而基于文本的方法需要描述性的上下文以更好地在特征和目標(biāo)變量之間建立語義關(guān)聯(lián)。這種方法利用了大型語言模型(LLMs)中豐富的語
    的頭像 發(fā)表于 12-03 01:06 ?1724次閱讀
    Kaggle知識(shí)<b class='flag-5'>點(diǎn)</b>:使用大<b class='flag-5'>模型</b>進(jìn)行特征篩選

    中國電信人工智能研究院完成首個(gè)全國產(chǎn)化萬萬參大模型訓(xùn)練

    近日,中國電信人工智能研究院宣布了一項(xiàng)重大技術(shù)突破:成功完成國內(nèi)首個(gè)基于全國產(chǎn)化萬集群訓(xùn)練的萬億參數(shù)大模型。
    的頭像 發(fā)表于 09-30 16:41 ?2057次閱讀