99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

知行科技大模型研發(fā)體系初見效果

知行科技iMotion ? 來源:知行科技iMotion ? 2024-12-27 09:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)的質(zhì)量和規(guī)模才是端到端的“命脈”

11月,知行科技作為共同第一作者提出的Strong Vision Transformers Could BeExcellent Teachers(ScaleKD),以預(yù)訓(xùn)練ViT(視覺Transformer)模型作為教師,CNN網(wǎng)絡(luò)作為學(xué)生進行學(xué)習(xí)。推進異構(gòu)神經(jīng)網(wǎng)絡(luò)間知識蒸餾研究的具體范式/方法,被收錄于NeurIPS 2024(第38屆神經(jīng)信息處理系統(tǒng)會議)。

這是知行科技構(gòu)建大模型體系能力的初步成果之一。2024年年中,知行科技開始從資源、組織等多線程入手,打造面向大模型的研發(fā)架構(gòu)體系,并完成組織架構(gòu)調(diào)整,引入包括清華大學(xué)計算機博士背景的大模型架構(gòu)師等多位大模型與自動駕駛領(lǐng)域?qū)<遥瑯?gòu)建起對齊主流的研發(fā)組織架構(gòu)和專家人才庫,為2025落地端到端大模型系統(tǒng)上車做好準備。

01構(gòu)建以數(shù)據(jù)為中心的開發(fā)體系

端到端讓所有智駕玩家有機會重新站上起跑線,但做端到端的挑戰(zhàn)并不全在于“模型”本身。

特斯拉FSD研發(fā)負責(zé)人Andrej Karpathy曾表示,特斯拉自動駕駛部門將3/4的精力用在采集、清洗、分類、標注高質(zhì)量數(shù)據(jù)上,只有1/4用于算法探索和模型創(chuàng)建。究其原因,數(shù)據(jù)是人工智能發(fā)展的燃料,而端到端大模型將AI的“油耗”水平推到了新的高度。

“100萬個視頻 Case 訓(xùn)練,勉強夠用;200萬個,稍好一些;300萬個,就會感到Wow;到了1000 萬個,就變得難以置信了?!碧厮估瓌?chuàng)始人馬斯克曾這樣量化FSD的訓(xùn)練數(shù)據(jù)需求。

問題是,雖然人類活動生生不息,有效數(shù)據(jù)卻不是源源不斷。ChatGPT 3 的開發(fā)文檔中提到,45TB的純文本質(zhì)量過濾后,僅獲得570GB的文本,有效數(shù)據(jù)僅為1.27%。大語言和多模態(tài)模型領(lǐng)域已經(jīng)開始出現(xiàn)高質(zhì)量的真實文本、視頻數(shù)據(jù)耗盡,性能撞墻的情況。

對自動駕駛來說,高質(zhì)量的數(shù)據(jù)多來自罕見路況和場景,產(chǎn)生條件苛刻,導(dǎo)致樣本量相對語言類更為稀缺,更是難以滿足大模型的參數(shù)需求。

目前,端到端自動駕駛系統(tǒng)上車帶來更上限的同時,也開始遭遇數(shù)據(jù)分布問題、高質(zhì)量數(shù)據(jù)不足,導(dǎo)致的部分場景性能回退、困難場景性能不穩(wěn)定的情況。

數(shù)據(jù)的質(zhì)量和規(guī)模才是端到端的“命脈”。知行科技在進入端到端賽道時,決定構(gòu)建“以數(shù)據(jù)為中心”的研發(fā)體系,用以滿足大模型對高質(zhì)量數(shù)據(jù)“貪婪”的特性。

知行科技重構(gòu)研發(fā)組織架構(gòu),形成大模型、模型部署、基礎(chǔ)設(shè)施、大數(shù)據(jù)等多模塊在內(nèi)的主流人工智能開發(fā)框架。其中,大模型組不僅在模型層面提供新的技術(shù)支持,在數(shù)據(jù)自動標注算法、基于擴散模型的數(shù)據(jù)生成、基于多模態(tài)大模型的數(shù)據(jù)挖掘方面也都有發(fā)力,以更低成本的數(shù)據(jù)生產(chǎn)為目標,保質(zhì)保量地滿足知行科技端到端大模型的數(shù)據(jù)需求。

02仿真數(shù)據(jù),數(shù)據(jù)戰(zhàn)爭的下一步

當數(shù)據(jù)需求是百萬clips起步時,應(yīng)該如何打這場數(shù)據(jù)戰(zhàn)爭?

知行科技一方面強化自有數(shù)據(jù)采集和標注能力,并與生態(tài)伙伴形成一定程度的數(shù)據(jù)協(xié)同;

在數(shù)據(jù)采集方面,知行科技已自建采集車隊,自主搭建數(shù)據(jù)采集軟件、車端采集系統(tǒng)和后端耦合系統(tǒng),實現(xiàn)數(shù)據(jù)采集全鏈條的自動化和高度可控,日采集效率達20萬幀,為BEV行泊車功能閉環(huán)量產(chǎn)提供必要的數(shù)據(jù)支持。

在數(shù)據(jù)標注方面,知行科技已經(jīng)建成自動化標注體系并在不斷地完善,在OD(障礙物檢測)、LD(車道線檢測)項目中實現(xiàn)完全自動標注,整體減少至少50%的數(shù)據(jù)標注成本。

與此同時,面向端到端系統(tǒng)海量數(shù)據(jù)需求,知行科技則借助大模型的能力,探索仿真數(shù)據(jù)的產(chǎn)業(yè)應(yīng)用前景。

12月,OpenAI和谷歌先后發(fā)布了視頻產(chǎn)品,提供文本、圖像、視頻轉(zhuǎn)視頻的功能,展現(xiàn)出擴散模型等大模型對現(xiàn)實世界極強的復(fù)現(xiàn)和“改寫”能力。事實上,包括特斯拉在內(nèi)的自動駕駛頭部玩家,也已正在加大仿真數(shù)據(jù)領(lǐng)域的投入。

因為,仿真數(shù)據(jù)在數(shù)據(jù)生產(chǎn)降本,和稀有場景數(shù)據(jù)獲得方面,有著至關(guān)重要的作用:

經(jīng)過良好預(yù)訓(xùn)練的大模型能夠“向前”,渲染復(fù)制現(xiàn)實世界生成圖像,并通過在虛擬世界中車輛動態(tài)擺放,僅用幾分鐘生成成千上萬段仿真場景信息;

也能夠“向后”推理,基于已有場景和環(huán)境信息,進行規(guī)劃控制的學(xué)習(xí),打通整個感知和規(guī)劃鏈路;

此外,基于對物理世界的理解,大模型還能夠通過改變場景中的關(guān)鍵數(shù)值,提升數(shù)采場景的有效比例。

目前,知行科技通過大模型進行數(shù)據(jù)生成已取得階段性成果:能夠使用原圖進行天氣,光照等條件的修改達到快速擴充真值的目標;通過給定特殊控制量,達到數(shù)據(jù)生產(chǎn)的目的。通過在自動標注和大模型數(shù)據(jù)生成方面的全面布局,知行科技在數(shù)據(jù)生產(chǎn)的降本和質(zhì)量提升方面,已取得實質(zhì)性進展。

此外,在數(shù)據(jù)挖掘方面,知行科技已初步建成ImoGPT-多模態(tài)大模型的安全解決方案,通過MoE(混合專家系統(tǒng))大模型,進行文本理解、圖片理解和視頻理解。其將在實現(xiàn)場景可解釋性、數(shù)據(jù)挖掘、端到端安全方案等多方面發(fā)揮重要作用。

03大模型,有教無類的“良師”

大模型可以是數(shù)據(jù)的生產(chǎn)者,也可以是端側(cè)小模型的“好老師”。

如ChatGPT解釋,憑借龐大的參數(shù)量和復(fù)雜的結(jié)構(gòu),大模型能夠通過海量數(shù)據(jù)訓(xùn)練,發(fā)現(xiàn)新的、更高層次的特征和模式,表現(xiàn)出未能預(yù)測、更復(fù)雜的能力和特性,實現(xiàn)智能的涌現(xiàn)?!坝楷F(xiàn)能力”也是大模型擴大使用場景,提升泛化性的核心。但大模型也存在計算資源消耗巨大、推理速度慢、模型可解釋性差的問題,難以被部署在計算和能耗都非常有限的端側(cè)。

如何使端模型也獲得相應(yīng)的知識和泛化能力,知識蒸餾(Knowledge Distillation)技術(shù)應(yīng)運而生:將大模型學(xué)到的知識遷移到一個更小的模型中,保持性能的同時降低模型部署難度和計算開銷。

知行科技被NeurIPS 收錄的ScaleKD,正是一種大模型知識蒸餾方法。

8c6d8532-c371-11ef-9310-92fbcf53809c.png

ScaleKD通過結(jié)合三個緊密耦合的組件(交叉注意力投影器,雙視圖特征模仿和教師參數(shù)感知),對齊云端教師模型和端側(cè)學(xué)生模型之間的特征計算范式差異、型規(guī)模差異和知識密度差異,實現(xiàn)任何目標學(xué)生模型在大規(guī)模數(shù)據(jù)集上的時間密集的預(yù)訓(xùn)練范式。

這意味著,大模型能夠作為“有教無類”的良師,將知識和規(guī)律“復(fù)制”到端側(cè)模型,大幅提升其性能和泛化性。

從前沿學(xué)術(shù)研究出發(fā),知行科技將根據(jù)實際中使用的端模型,構(gòu)建對應(yīng)的老師模型進行訓(xùn)練,獲得更強的能力,從而通過知識蒸餾提高端模型的學(xué)習(xí)效果和速度。

端到端大模型的應(yīng)用,為智能駕駛玩家?guī)碇匦麻_局的機會。中國的場景復(fù)雜性、市場需求,中國團隊工程化和應(yīng)用落地的能力,以及大模型技術(shù)領(lǐng)域不斷涌現(xiàn)的新能力,使后來者能夠快速、確定性地切入賽道。

知行科技著力構(gòu)建的數(shù)據(jù)生產(chǎn)能力,積累的高質(zhì)量數(shù)據(jù),將為端到端模型訓(xùn)練提供源源不斷的”燃料“,推動智駕功能從“能用”、“好用”,走向消費者“愛用”的未來。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動駕駛
    +關(guān)注

    關(guān)注

    789

    文章

    14321

    瀏覽量

    170634
  • 知行科技
    +關(guān)注

    關(guān)注

    1

    文章

    66

    瀏覽量

    3685
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3146

    瀏覽量

    4068

原文標題:備戰(zhàn)端到端,知行科技大模型研發(fā)體系初見效果

文章出處:【微信號:gh_dd1765c34afb,微信公眾號:知行科技iMotion】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    電子科技大學(xué)深圳高等研究院領(lǐng)導(dǎo)蒞臨景嘉微調(diào)研考察

    近日,電子科技大學(xué)(深圳)高等研究院黨委書記鄒見效率隊蒞臨景嘉微進行調(diào)研考察。隨行領(lǐng)導(dǎo)包括高等研究院院長助理、人力資源中心主任高晶,科研發(fā)展中心主任王柯,以及先進技術(shù)研究院副院長劉蓉等。景嘉微董事長兼總裁曾萬輝,副總經(jīng)理曹澤文,
    的頭像 發(fā)表于 07-15 14:49 ?231次閱讀

    知行科技30天內(nèi)獲得14款車型定點

    近日,知行科技收到某頭部自主品牌5款車型的定點函,包括主流量產(chǎn)乘用車和商用車等多種車型。知行科技將為其提供iDC輔助駕駛域控和iFC前視一體機等多種解決方案,充分滿足不同車型定位,和海內(nèi)外市場的差異化需求。
    的頭像 發(fā)表于 07-15 10:30 ?159次閱讀

    知行科技全資子公司擬收購小工匠機器人大部分股份

    近日,知行科技旗下專注機器人研發(fā)及商業(yè)化的全資子公司艾摩星機器人與蘇州小工匠機器人有限公司(“小工匠”)簽署股權(quán)轉(zhuǎn)讓框架協(xié)議,艾摩星機器人將出資收購小工匠大部分股份,成為控股股東。以此為開端,知行科技正快速提升在機器人關(guān)鍵部件層
    的頭像 發(fā)表于 05-13 14:51 ?451次閱讀

    知行汽車科技宣布更名“知行科技”

    3月17日,知行汽車科技(蘇州)股份有限公司(1274.HK)股票簡稱從“知行汽車科技”變更為“知行科技”,以更好反應(yīng)公司的業(yè)務(wù)范圍——新切入機器人領(lǐng)域。
    的頭像 發(fā)表于 03-13 16:55 ?642次閱讀

    請問如何能讓模型效果更好?

    重現(xiàn)步驟 我用yolov8n訓(xùn)練出的模型,跑出來的識別是沒有問題的,問題是在部署到開發(fā)板上,無論是穩(wěn)定性還是框的大小以及識別的準確性都比較差,再試了幾次訓(xùn)練后的效果還是不好,請問有什么更多的解決辦法
    發(fā)表于 03-11 07:21

    字節(jié)豆包大模型團隊提出稀疏模型架構(gòu)

    字節(jié)跳動豆包大模型Foundation團隊近期研發(fā)出UltraMem,一種創(chuàng)新的稀疏模型架構(gòu),旨在解決推理過程中的訪存問題,同時確保模型效果
    的頭像 發(fā)表于 02-13 15:25 ?637次閱讀

    知行科技獲超2億元融資,加速AI高階智駕研發(fā)與海外拓展

    近日,知行科技宣布成功完成新一輪超2億元的融資。這筆資金將主要用于提升其研發(fā)能力,特別是在基于人工智能(AI)的高階智能駕駛、艙駕一體解決方案及產(chǎn)品方面。此外,知行科技還將利用這部分資金升級優(yōu)化
    的頭像 發(fā)表于 02-13 14:34 ?642次閱讀

    知行科技完成新一輪超2億元融資

    知行科技新一輪超2億元融資將主要用于提升研發(fā)能力,包括基于AI的高階智駕、艙駕一體解決方案及產(chǎn)品,升級優(yōu)化研發(fā)生產(chǎn)設(shè)施,進一步擴大海外市場。
    的頭像 發(fā)表于 02-12 18:18 ?757次閱讀

    知行科技與地平線簽署戰(zhàn)略合作協(xié)議

    和服務(wù)。通過深度合作,雙方將攜手開拓國內(nèi)外智能駕駛市場,推動智能駕駛技術(shù)的普及與應(yīng)用,為智能駕駛行業(yè)的可持續(xù)發(fā)展貢獻力量。 知行科技作為智能駕駛領(lǐng)域的領(lǐng)先企業(yè),一直致力于智能駕駛技術(shù)的研發(fā)與創(chuàng)新。而地平線則擁有
    的頭像 發(fā)表于 01-23 16:27 ?1886次閱讀

    知行科技與地平線達成戰(zhàn)略合作

    近日,知行科技與地平線正式簽署了戰(zhàn)略合作協(xié)議,標志著雙方在智能駕駛技術(shù)領(lǐng)域的合作邁出了堅實的一步。 根據(jù)協(xié)議內(nèi)容,雙方將共同致力于智能駕駛技術(shù)的研發(fā)與應(yīng)用。特別是在2025年下半年,基于地平線征程6
    的頭像 發(fā)表于 01-23 10:52 ?1835次閱讀

    「2024中國AIEV產(chǎn)業(yè)智駕創(chuàng)新企業(yè)」揭榜,文遠知行光榮上榜

    ,這一榮譽不僅是對文遠知行多年來在自動駕駛技術(shù)研發(fā)與創(chuàng)新應(yīng)用方面的高度認可,更標志著其在推動AIEV(人工智能電動汽車)產(chǎn)業(yè)發(fā)展進程中發(fā)揮著至關(guān)重要的作用。文遠知行
    的頭像 發(fā)表于 01-08 11:37 ?528次閱讀
    「2024中國AIEV產(chǎn)業(yè)智駕創(chuàng)新企業(yè)」揭榜,文遠<b class='flag-5'>知行</b>光榮上榜

    南方科技大學(xué)OpenHarmony技術(shù)俱樂部正式揭牌成立

    科技大學(xué)會議中心舉行。 嘉賓合影 南方科技大學(xué)黨委書記姜虹出席大會并發(fā)表致辭。她表示,南方科技大學(xué)肩負著服務(wù)國家戰(zhàn)略的重任,積極推動教育、人才、產(chǎn)業(yè)與創(chuàng)新鏈的深度整合。我校電子與電氣工程系成功構(gòu)建了APP開發(fā)實踐
    的頭像 發(fā)表于 01-05 19:32 ?1128次閱讀
    南方<b class='flag-5'>科技大</b>學(xué)OpenHarmony技術(shù)俱樂部正式揭牌成立

    文遠知行在珠海橫琴新設(shè)科技公司

    的經(jīng)營范圍相當廣泛,涵蓋了人工智能理論與算法軟件開發(fā)、智能機器人的研發(fā)等前沿技術(shù)領(lǐng)域。這不僅體現(xiàn)了文遠知行在技術(shù)研發(fā)上的深厚實力,也預(yù)示著其在未來智能化、自動化領(lǐng)域的持續(xù)深耕。同時,公司還涉足汽車零配件批發(fā)、汽車銷售
    的頭像 發(fā)表于 12-03 13:44 ?450次閱讀

    知行機器人獲誠美資本與中關(guān)村智友聯(lián)合領(lǐng)投

    近日,知行機器人宣布成功完成新一輪融資,本輪融資由誠美資本與中關(guān)村智友科學(xué)家基金聯(lián)合領(lǐng)投。此次融資的成功,標志著知行機器人在資本市場上的強勁發(fā)展勢頭,也為其未來的發(fā)展注入了新的動力。 知行機器人成立
    的頭像 發(fā)表于 10-30 10:40 ?771次閱讀

    如何評估AI大模型效果

    評估AI大模型效果是一個復(fù)雜且多維度的過程,涉及多個方面的考量。以下是一些關(guān)鍵的評估方法和步驟: 一、基準測試(Benchmarking) 使用標準數(shù)據(jù)集和任務(wù)來評估模型的性能,如GLUE
    的頭像 發(fā)表于 10-23 15:21 ?3104次閱讀