99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

昆侖芯重磅打造xHuggingface開(kāi)源推理套件

昆侖芯科技 ? 來(lái)源:昆侖芯科技 ? 2023-07-23 09:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

新一輪人工智能熱潮下,國(guó)內(nèi)大模型群雄逐鹿,目前已有超過(guò)80個(gè)大模型公開(kāi)測(cè)試。而相關(guān)數(shù)據(jù)顯示,ChatGPT自發(fā)布以來(lái),全球訪問(wèn)量環(huán)比增幅持續(xù)下降,6月首次出現(xiàn)環(huán)比下滑9.7%。泡沫退去,如何在大模型時(shí)代保持市場(chǎng)競(jìng)爭(zhēng)力?

針對(duì)大模型場(chǎng)景,昆侖芯早已在產(chǎn)品定義上作出布局,相較第一代產(chǎn)品,昆侖芯2代AI芯片可大幅優(yōu)化算力、互聯(lián)和高性能,而在研的下一代產(chǎn)品則將提供更佳的性能體驗(yàn)。

在近日落幕的XceedCon2023人工智能芯片生態(tài)大會(huì)上,昆侖芯大模型端到端解決方案正式發(fā)布,該解決方案隨即入選2023世界人工智能大會(huì)卓越人工智能引領(lǐng)者獎(jiǎng)(Super AI Leader,簡(jiǎn)稱SAIL獎(jiǎng))TOP30榜單。

昆侖芯副總裁王勇、昆侖芯互聯(lián)網(wǎng)行業(yè)總經(jīng)理王志鵬先后在XceedCon2023人工智能芯片生態(tài)大會(huì)、2023世界人工智能大會(huì)對(duì)昆侖芯大模型端到端解決方案進(jìn)行發(fā)布與推介。本篇以下內(nèi)容整理自現(xiàn)場(chǎng)實(shí)錄。

軟硬協(xié)同、技術(shù)創(chuàng)新

打造高性能產(chǎn)品矩陣

集十余年AI加速領(lǐng)域研發(fā)積累,昆侖芯核心團(tuán)隊(duì)于2017年在Hot Chips上發(fā)布自研、面向通用人工智能計(jì)算的芯片核心架構(gòu)——昆侖芯XPU。目前,已有兩代昆侖芯AI芯片基于該架構(gòu)實(shí)現(xiàn)量產(chǎn)和規(guī)模部署。

昆侖芯XPU專為密集型計(jì)算而設(shè)計(jì),相比GPU可提供更多AI加速單元,同時(shí)支持C/C++、類CUDA語(yǔ)法編程,兼具高性能和可編程性,適配幾乎所有主流AI場(chǎng)景,滿足不同行業(yè)的大模型訓(xùn)推需求。

大模型的演進(jìn)必將伴隨參數(shù)量的增加,更加依賴于分布式訓(xùn)練與推理能力。昆侖芯2代系列產(chǎn)品搭載新一代核心架構(gòu)XPU-R,性能相較一代提升2-3倍,在分布式場(chǎng)景中優(yōu)勢(shì)明顯。

01.

大顯存

昆侖芯2代產(chǎn)品擁有32GB顯存容量,在同價(jià)位產(chǎn)品中內(nèi)存優(yōu)勢(shì)突出。

02.

高互聯(lián)

昆侖芯通過(guò)領(lǐng)先技術(shù),可實(shí)現(xiàn)單機(jī)八卡高速互聯(lián),帶寬達(dá)到200GB/s;支持Direct RDMA,可實(shí)現(xiàn)跨機(jī)間低延時(shí)、高速通訊。

昆侖芯推出針對(duì)不同參數(shù)級(jí)別的大模型產(chǎn)品矩陣,兼具顯存和算力成本優(yōu)勢(shì)。

昆侖芯AI加速卡R200-8F面向百億以內(nèi)參數(shù)量級(jí),相比同類型產(chǎn)品性能提升20%;

昆侖芯AI加速器組R480-X8面向百億至千億參數(shù)量級(jí),性能達(dá)到同類型產(chǎn)品的1.3倍以上;

昆侖芯AI加速器組R480-X8集群針對(duì)千億以上參數(shù)量級(jí),可實(shí)現(xiàn)多機(jī)多卡分布式推理。

昆侖芯大模型解決方案軟件棧

軟件生態(tài)層面,昆侖芯提供了針對(duì)大模型場(chǎng)景的專用加速庫(kù)、豐富的云原生插件,支持文心一言、LLaMA、Bloom、ChatGLM、GPT等行業(yè)主流大模型。

昆侖芯XFT(XPU Fast Transformer)推理加速庫(kù),較原生框架小算子版本性能提升5倍以上。目前,XFT加速庫(kù)已與百度飛槳、PyTorch等主流深度學(xué)習(xí)框架完成適配;

昆侖芯云原生插件可幫助用戶快速完成和大模型平臺(tái)的適配;同時(shí)提供昆侖芯SDK,幫助用戶快速完成適配和實(shí)時(shí)自定義開(kāi)發(fā)。

昆侖芯xHuggingface開(kāi)源推理套件

此外,昆侖芯全面擁抱開(kāi)源社區(qū),積極攜手生態(tài)伙伴構(gòu)建軟硬一體的AI芯片生態(tài)。

昆侖芯打造了xHuggingface開(kāi)源推理套件,僅修改1-2行代碼,即可快速搭建基于XPU的智能客服APP。同時(shí),昆侖芯與飛槳PaddlePaddle的AI Studio社區(qū)緊密合作,基于xHuggingface開(kāi)源推理套件向廣大開(kāi)發(fā)者提供更快、更強(qiáng)、更省的算力產(chǎn)品;

昆侖芯與飛槳深入?yún)f(xié)同適配行業(yè)主流大模型,可支持超大規(guī)模分布式訓(xùn)練與推理。針對(duì)稠密大模型,昆侖芯支持飛槳的Sharding并行、數(shù)據(jù)并行、模型并行、流水線并行四種并行方式;針對(duì)稀疏大模型,昆侖芯與飛槳共同打造大規(guī)模參數(shù)服務(wù)器架構(gòu),實(shí)現(xiàn)了萬(wàn)億參數(shù)的大模型訓(xùn)練。

深入場(chǎng)景、真實(shí)歷練

打磨端到端解決方案

昆侖芯深入了解不同應(yīng)用場(chǎng)景下客戶的真實(shí)需求,憑借軟硬協(xié)同技術(shù)與高性能產(chǎn)品矩陣,為千行百業(yè)提供開(kāi)箱即用的產(chǎn)品和全棧式AI服務(wù)。

大語(yǔ)言模型場(chǎng)景

昆侖芯推理加速方案

目前,昆侖芯已與業(yè)界主流開(kāi)源大模型完成適配,向客戶開(kāi)放開(kāi)源軟件庫(kù),供客戶進(jìn)行二次修改、微調(diào),滿足不同推理場(chǎng)景下的個(gè)性化定制需求。

GPT百億參數(shù)大模型場(chǎng)景:昆侖芯產(chǎn)品的QPS相比主流165W產(chǎn)品提高30%以上,同時(shí)首字時(shí)延更低。

文心一格:目前已大規(guī)模應(yīng)用昆侖芯產(chǎn)品,成本降低的同時(shí),可實(shí)現(xiàn)2秒快速出圖。

昆侖芯訓(xùn)練產(chǎn)品總覽

針對(duì)大語(yǔ)言模型訓(xùn)練場(chǎng)景,昆侖芯也可提供一整套精調(diào)的訓(xùn)練策略。目前,昆侖芯已適配pretrain、post-pretrain、SFT、LoRA等模型,可根據(jù)客戶的數(shù)據(jù)量與計(jì)算資源情況,靈活推薦不同的訓(xùn)練模式。

能源行業(yè):昆侖芯解決方案通過(guò)SFT訓(xùn)練模式,客戶僅使用少量數(shù)據(jù)即可2天打造專屬行業(yè)大模型。

智源研究院:昆侖芯和智源研究院在大模型方面已有深入合作。昆侖芯已完成和Aquila大語(yǔ)言模型推理任務(wù)的適配、精度調(diào)試和性能優(yōu)化,并實(shí)現(xiàn)大規(guī)模分布式推理上線,訓(xùn)練任務(wù)適配優(yōu)化中;同時(shí)也適配了智源eva視覺(jué)大模型,初步驗(yàn)證了大規(guī)模分布式預(yù)訓(xùn)練能力。

稀疏大模型推薦場(chǎng)景

稀疏大模型存在訓(xùn)練門(mén)檻高、算力消耗大等技術(shù)挑戰(zhàn)。對(duì)于算法和模型持續(xù)高頻迭代的推薦場(chǎng)景,昆侖芯始終將“安全可信”、“從GPU零成本無(wú)縫遷移”作為目標(biāo),實(shí)現(xiàn)訓(xùn)練與推理系統(tǒng)的緊密耦合,為客戶降本增效。目前,昆侖芯已與互聯(lián)網(wǎng)頭部客戶完成了訓(xùn)練場(chǎng)景的端到端聯(lián)合開(kāi)發(fā),并在TB級(jí)以上稀疏大模型上完成了“替換主流GPU的全量上線”。

大模型的持續(xù)迭代加速了我國(guó)AI技術(shù)及AI產(chǎn)業(yè)的演進(jìn),利好政策的相繼出臺(tái)同時(shí)開(kāi)啟了我國(guó)大模型商用浪潮。面向未來(lái),昆侖芯將始終堅(jiān)持軟硬協(xié)同創(chuàng)新,夯實(shí)AI領(lǐng)域綜合優(yōu)勢(shì),加速大模型產(chǎn)業(yè)落地,勇立大模型時(shí)代潮頭。

責(zé)任編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4949

    瀏覽量

    131320
  • 開(kāi)源
    +關(guān)注

    關(guān)注

    3

    文章

    3695

    瀏覽量

    43852
  • 昆侖芯科技
    +關(guān)注

    關(guān)注

    0

    文章

    33

    瀏覽量

    856

原文標(biāo)題:來(lái)了!一文讀懂昆侖芯大模型端到端解決方案

文章出處:【微信號(hào):昆侖芯科技,微信公眾號(hào):昆侖芯科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    昆侖超節(jié)點(diǎn)產(chǎn)品推出,大模型訓(xùn)推任務(wù)性能跨越式提升

    ? 開(kāi)年后,隨著DeepSeek席卷千行百業(yè),昆侖率先適配、業(yè)內(nèi)首家單機(jī)部署滿血版展示卓越性能,并在互聯(lián)網(wǎng)、科研、金融等領(lǐng)域?qū)崿F(xiàn)規(guī)模部署,一系列進(jìn)展引發(fā)廣泛關(guān)注。剛剛落幕的Create2025百度
    的頭像 發(fā)表于 04-25 19:29 ?1077次閱讀

    首創(chuàng)開(kāi)源架構(gòu),天璣AI開(kāi)發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    錄音人聲質(zhì)量,將vivo X200s打造成安卓首款K歌旗艦手機(jī),并獲得臻品錄音Pro級(jí)認(rèn)證,給用戶帶來(lái)一款錄音室級(jí)的K歌神器。 基于天璣AI開(kāi)發(fā)套件開(kāi)源彈性架構(gòu),聯(lián)發(fā)科還與美圖合作完成美圖自研
    發(fā)表于 04-13 19:52

    昆侖科技亮相2025中關(guān)村論壇

    此前,3月27日至31日,2025中關(guān)村論壇在京舉辦,昆侖科技與中國(guó)移動(dòng)首次公開(kāi)展示聯(lián)合產(chǎn)業(yè)合作伙伴共同開(kāi)發(fā)的64卡超節(jié)點(diǎn)智算服務(wù)器。該服務(wù)器依托昆侖P800,采用OISA技術(shù)
    的頭像 發(fā)表于 04-02 11:22 ?666次閱讀

    昆侖服務(wù)器中標(biāo)招商銀行AI芯片資源項(xiàng)目

    近日,昆侖服務(wù)器中標(biāo)招商銀行AI芯片資源項(xiàng)目。基于該項(xiàng)目,昆侖P800將圍繞多個(gè)核心業(yè)務(wù)場(chǎng)景,全面支持招商銀行落地大模型應(yīng)用。
    的頭像 發(fā)表于 03-28 14:47 ?791次閱讀

    【幸狐Omni3576邊緣計(jì)算套件試用體驗(yàn)】RKNN 推理測(cè)試與圖像識(shí)別

    【幸狐 Omni3576 邊緣計(jì)算套件測(cè)評(píng)】RKNN 推理測(cè)試與圖像識(shí)別 本文介紹了幸狐 Omni3576 邊緣計(jì)算套件實(shí)現(xiàn) RKNN 推理和圖像物體識(shí)別的測(cè)試流程,包括 RKNN 介
    發(fā)表于 03-20 16:14

    將英特爾?獨(dú)立顯卡與OpenVINO?工具套件結(jié)合使用時(shí),無(wú)法運(yùn)行推理怎么解決?

    使用英特爾?獨(dú)立顯卡與OpenVINO?工具套件時(shí)無(wú)法運(yùn)行推理
    發(fā)表于 03-05 06:56

    首發(fā) | 昆侖 | 國(guó)產(chǎn)AI卡Deepseek訓(xùn)練推理全版本適配、性能卓越,一鍵部署等您來(lái)(附文檔下載方式)

    編者按:本文是昆侖適配DeepSeek系列推文第一篇,將于近期分別推出在昆侖P800上進(jìn)行DeepSeek-V3/R1推理、訓(xùn)練的深度文
    發(fā)表于 02-06 15:28 ?929次閱讀
    首發(fā) | <b class='flag-5'>昆侖</b><b class='flag-5'>芯</b> | 國(guó)產(chǎn)AI卡Deepseek訓(xùn)練<b class='flag-5'>推理</b>全版本適配、性能卓越,一鍵部署等您來(lái)(附文檔下載方式)

    昆侖率先完成Deepseek訓(xùn)練推理全版本適配

    本文是昆侖適配DeepSeek系列推文第一篇,將于近期分別推出在昆侖P800上進(jìn)行DeepSeek-V3/R1推理、訓(xùn)練的深度文章,干貨
    的頭像 發(fā)表于 02-06 15:13 ?1481次閱讀
    <b class='flag-5'>昆侖</b><b class='flag-5'>芯</b>率先完成Deepseek訓(xùn)練<b class='flag-5'>推理</b>全版本適配

    昆侖P800萬(wàn)卡集群成功點(diǎn)亮,將進(jìn)一步點(diǎn)亮3萬(wàn)卡集群

    ? 近日,百度智能云成功點(diǎn)亮昆侖三代萬(wàn)卡集群,這也是國(guó)內(nèi)首個(gè)正式點(diǎn)亮的自研萬(wàn)卡集群。百度智能云將進(jìn)一步點(diǎn)亮3萬(wàn)卡集群。 國(guó)產(chǎn)昆侖萬(wàn)卡集群以及未來(lái)三萬(wàn)卡集群的建設(shè),從硬件到軟件,技術(shù)
    發(fā)表于 02-05 17:58 ?516次閱讀
    <b class='flag-5'>昆侖</b><b class='flag-5'>芯</b>P800萬(wàn)卡集群成功點(diǎn)亮,將進(jìn)一步點(diǎn)亮3萬(wàn)卡集群

    新品| LLM630 Compute Kit,AI 大語(yǔ)言模型推理開(kāi)發(fā)平臺(tái)

    LLM630LLM推理,視覺(jué)識(shí)別,可開(kāi)發(fā),靈活擴(kuò)展···LLM630ComputeKit是一款A(yù)I大語(yǔ)言模型推理開(kāi)發(fā)平臺(tái),專為邊緣計(jì)算和智能交互應(yīng)用而設(shè)計(jì)。該套件的主板搭載愛(ài)AX63
    的頭像 發(fā)表于 01-17 18:48 ?705次閱讀
    新品| LLM630 Compute Kit,AI 大語(yǔ)言模型<b class='flag-5'>推理</b>開(kāi)發(fā)平臺(tái)

    昆侖科技一行到訪京能集團(tuán)

    近日,昆侖CEO歐陽(yáng)劍、副總裁孫孝思一行到訪京能集團(tuán),與京能集團(tuán)黨委書(shū)記、董事長(zhǎng)郭明星,副總經(jīng)理陳國(guó)高、張鳳陽(yáng)會(huì)面并開(kāi)展座談。圍繞推動(dòng)科技創(chuàng)新、發(fā)展新質(zhì)生產(chǎn)力等領(lǐng)域的業(yè)務(wù)合作,昆侖
    的頭像 發(fā)表于 01-14 10:50 ?1309次閱讀

    阿里云開(kāi)源推理大模型QwQ

    近日,阿里云通義團(tuán)隊(duì)宣布推出全新AI推理模型QwQ-32B-Preview,并同步實(shí)現(xiàn)了開(kāi)源。這一舉措標(biāo)志著阿里云在AI推理領(lǐng)域邁出了重要一步。 據(jù)評(píng)測(cè)數(shù)據(jù)顯示,QwQ預(yù)覽版本已具備研究生水平的科學(xué)
    的頭像 發(fā)表于 11-29 11:30 ?1178次閱讀

    李開(kāi)復(fù):中國(guó)擅長(zhǎng)打造經(jīng)濟(jì)實(shí)惠的AI推理引擎

    10月22日上午,零一萬(wàn)物公司的創(chuàng)始人兼首席執(zhí)行官李開(kāi)復(fù)在與外媒的交流中透露,其公司旗下的Yi-Lightning(閃電模型)在推理成本上已實(shí)現(xiàn)了顯著優(yōu)勢(shì),比OpenAI的GPT-4o模型低了31倍。他強(qiáng)調(diào),中國(guó)擅長(zhǎng)打造經(jīng)濟(jì)實(shí)惠的AI
    的頭像 發(fā)表于 10-22 16:54 ?745次閱讀

    國(guó)產(chǎn)上運(yùn)行TinyMaxi輕量級(jí)的神經(jīng)網(wǎng)絡(luò)推理庫(kù)-米爾基于馳D9國(guó)產(chǎn)商顯板

    本篇測(cè)評(píng)由優(yōu)秀測(cè)評(píng)者“短笛君”提供。本文將介紹基于米爾電子MYD-YD9360商顯板(米爾基于馳D9360國(guó)產(chǎn)開(kāi)發(fā)板)的TinyMaxi輕量級(jí)的神經(jīng)網(wǎng)絡(luò)推理庫(kù)方案測(cè)試。 算力測(cè)試TinyMaix
    發(fā)表于 08-09 18:26

    國(guó)產(chǎn)上運(yùn)行TinyMaxi輕量級(jí)的神經(jīng)網(wǎng)絡(luò)推理庫(kù)-米爾基于馳D9國(guó)產(chǎn)商顯板

    本帖最后由 blingbling111 于 2024-8-8 09:23 編輯 本篇測(cè)評(píng)由與非網(wǎng)的優(yōu)秀測(cè)評(píng)者“短笛君”提供。本文將介紹基于米爾電子MYD-YD9360商顯板(米爾基于
    發(fā)表于 08-07 18:06