99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

虹軟推出新一代視覺大模型ArcMuse 2025 V1.1

虹軟 ? 來源:虹軟 ? 2025-03-05 17:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大模型從最初的“不計成本”探索,到如今的“可持續(xù)”商業(yè)化落地,經(jīng)歷了從技術(shù)突破到工程優(yōu)化,再到產(chǎn)業(yè)融合的深度演進(jìn)。在這一過程中,虹軟始終走在創(chuàng)新前沿,依托深厚的視覺AI技術(shù)積累,以ArcMuse計算技術(shù)引擎為核心,不斷推動視覺大模型的技術(shù)進(jìn)步與行業(yè)落地,加速AI在各領(lǐng)域的深度應(yīng)用。

自2023年推出以來,ArcMuse計算技術(shù)引擎憑借持續(xù)的 算法創(chuàng)新與工程優(yōu)化 ,構(gòu)建起多層次架構(gòu)、跨模型協(xié)同優(yōu)化、高效能計算引擎等核心能力,不斷突破通用大模型在計算成本、適配效率、推理速度等方面的局限。如今,經(jīng)過對算法、數(shù)據(jù)、工程及大模型生態(tài)的全面優(yōu)化,ArcMuse迎來了全新升級 —— ArcMuse 2025 V1.1版本。新一代ArcMuse在生成質(zhì)量、計算效率、端側(cè)適配性等方面取得了顯著突破 , 進(jìn)一步 增強了視覺大模型的泛化能力與實用性 。其先進(jìn)的視覺AI能力全面支持智能手機智能汽車、AI眼鏡、機器人、服裝智造以及智能商拍的創(chuàng)新發(fā)展。

ArcMuse 2025 總體架構(gòu)與核心愿景:視覺AI核心基座引擎,不止大模型

ArcMuse是一個 兼顧效果和性能的緊湊AI綜合體 ,它以大底模和強化的垂直大模型為基礎(chǔ),用以生成遠(yuǎn)觀悅目的基礎(chǔ)效果,并利用一系列復(fù)雜或簡單細(xì)分小模型、淺層模型、用于約束的CV&CG引擎包對基礎(chǔ)效果進(jìn)行控制,以達(dá)到近看自然、結(jié)構(gòu)信息正確、細(xì)節(jié)豐富合理的最終圖像和視頻效果。

ArcMuse 2025核心思想與架構(gòu):

ArcMuse是一套深度耦合底模、細(xì)分大模型、控制淺層復(fù)雜模型和視覺庫、約束細(xì)節(jié)的淺層小模型和視覺庫,數(shù)據(jù)預(yù)處理引擎包、CV&CG處理引擎包、定制化文本生成模型的緊湊穩(wěn)定AI平臺庫。

CPG(Control Packages) : 利用五大類小模型和引擎包對期望的結(jié)果進(jìn)行約束與控制。

人 物: 手、臉、腳、四肢、體

深度: 各類攝像頭、模組、模式的輸入,都能得到高質(zhì)量的深度

分割: 基于對象、區(qū)域、語義等

分類: 景、物、影調(diào)、情感等

邊緣: 強、弱、結(jié)構(gòu)、遮擋、懸空等

KDE(Keep Details Engines) :利用一些淺層模型保留弱紋理和細(xì)節(jié),利用光照模型分析、去除、重光照處理和維持影調(diào)(Shading)。

高效計算優(yōu)化: 采用FP8混合精度計算,對核心計算復(fù)雜度高的OPs進(jìn)行匯編級優(yōu)化。

訓(xùn)練和推理時的減冗余并行處理引擎包 :這點得益于公司定位實際應(yīng)用落地有回報的降本壓力,進(jìn)而研發(fā)出高效的基礎(chǔ)引擎和策略。

平臺無關(guān)化的各種處理 :依托虹軟 20 余年的視覺AI技術(shù)積累,使 ArcMuse 具備跨平臺適配能力,可靈活部署于云端、高性能計算平臺、移動端及嵌入式設(shè)備。

從實用落地的角度來看,真正可行的 AI 大模型方案必須實現(xiàn) 多層次協(xié)同與功能模塊互補 ,降低計算成本,以推動大模型應(yīng)用平權(quán)化,使其更廣泛地賦能終端設(shè)備與各行業(yè)。ArcMuse 2025 正是基于這一理念讓視覺 AI 在真實應(yīng)用場景中 實現(xiàn)性能、效果與成本的三重突破 。

從 DeepSeek 到 ArcMuse 2025:構(gòu)建大模型新范式

AI 計算的高效降本是大模型商業(yè)可行化落地的關(guān)鍵,其核心在于 降低計算資源消耗 、 減少存儲需求與數(shù)據(jù)依賴 ,以更低的成本提供可接受甚至卓越的AI性能,使先進(jìn)AI技術(shù)(包括大模型)能夠更廣泛地惠及各行業(yè)與終端設(shè)備。要實現(xiàn)這一目標(biāo),僅依賴單一大模型或傳統(tǒng)Transformer架構(gòu)的頂級云計算平臺遠(yuǎn)遠(yuǎn)不夠,而必須借助 多AI范式的深度耦合 ,并具備 動態(tài)多層次的自適應(yīng)能力的AI計算架構(gòu) ,以應(yīng)對不同計算環(huán)境的需求。

在這點上, DeepSeek 在文本和規(guī)則性較強的AI任務(wù)(如數(shù)學(xué)、代碼等) 上的策略,提供了一個典型的成功案例。其通過 DS-MOE(動態(tài)路由稀疏專家網(wǎng)絡(luò))、MLA(KV矩陣緩存壓縮)、MTP(多Token預(yù)測)、FP8(混合精度量化訓(xùn)練)、GRPO (強化學(xué)習(xí)采用群組相對策略優(yōu)化)、DualPipe(調(diào)度算法) 等優(yōu)化策略,極大提升了大模型的計算效率,并降低了硬件成本,為大模型高效降本提供了新的思路。然而,DeepSeek 在推理計算與存儲占用上仍然存在一定的優(yōu)化空間,特別是對于圖像、視頻等視覺任務(wù)而言,如何借鑒這些優(yōu)化思想,并結(jié)合視覺AI的獨特需求,是一個關(guān)鍵課題。

在這一背景下, 虹軟對 DeepSeek 的優(yōu)化策略進(jìn)行了深入分析 ,并結(jié)合自身在視覺 AI領(lǐng)域的多年研發(fā)經(jīng)驗,取長補短、深度融合,同時針對視覺 AI 的特性進(jìn)行了 定制化優(yōu)化 。實踐證明,這一耦合總體上帶來了 顯著的增益 ,不僅全面提升了ArcMuse的性能,尤其在 多模態(tài)數(shù)據(jù)理解、圖像與視頻推理增強方面效果突出 ;同時, 計算成本大幅降低 ,例如,在提示詞工程推理方面, 顯卡租賃成本減少了一半以上 ,使大模型的 AI計算更高效且可控 。

為直觀展現(xiàn) ArcMuse 2025 在視覺生成、影像修復(fù)及視頻生成方面的能力,我們以非剛體拓?fù)潆y以保持的柔性衣物為背景,呈現(xiàn)其在復(fù)雜視覺任務(wù)中的卓越表現(xiàn)。

生成圖像示例1:

弱紋理、細(xì)節(jié)提升

生成圖像示例2:

細(xì)節(jié)、影調(diào)的提升

困難場景(Hard Case)示例:半透物(薄紗)、柔性物(裙裝)、復(fù)雜版型(塞腰、束腕)、弱紋理細(xì)節(jié)(紋理花紋、花邊領(lǐng)、暗條紋)

生成圖像示例4 :

AI模特圖大角度、模特表現(xiàn)力更新

生成圖像示例5 :

AI生成圖的光影效果、模特表現(xiàn)力更新

生成視頻示例6:

AI模特復(fù)雜動作的穩(wěn)定性、表現(xiàn)力更新

生成圖像示例7:半透裝、碎花裙

生成視頻示例8:

讓示例7生成圖像再動起來

ArcMuse 2025 為垂直行業(yè)提供定制化解決方案

ArcMuse 2025 的架構(gòu)是一種系統(tǒng)性優(yōu)化方案,通過整合多個 AI 引擎,實現(xiàn)高效協(xié)同,即使在有限資源下仍能發(fā)揮最大效能,并為各類垂直行業(yè)提供定制化解決方案。這一架構(gòu)理念使 ArcMuse 成為 虹軟視覺 AI 賦能引擎 ,可廣泛應(yīng)用于移動智能終端 AI 影像處理、智能汽車、AI 眼鏡、XR 3D 空間計算頭顯、服裝智造和智能商拍以及智能機器人等垂直場景,推動行業(yè)創(chuàng)新升級。

在AI影像處理方面,ArcMuse 2025對AI影像模型進(jìn)行了優(yōu)化,特別是在圖像增強與影像細(xì)節(jié)恢復(fù)過程中,顯著減少了生成不真實效果的風(fēng)險。升級后的模型在處理復(fù)雜紋理和高對比度場景時,展現(xiàn)出較為穩(wěn)定的增強效果,降低了圖像生成中的不確定性。另外,在語義分割與識別方面,ArcMuse 2025進(jìn)一步增強了ArcMuse 2024對圖像內(nèi)容的理解精度,尤其是在文字紋理處理上,表現(xiàn)出比以往更強的模型細(xì)節(jié)還原能力。

在智能汽車方向,ArcMuse 2025的推理能力和場景理解能力得到提升,尤其在低能見度和復(fù)雜路況環(huán)境下,其優(yōu)化后的推理方法能夠結(jié)合不同的駕駛環(huán)境進(jìn)行分析,為駕駛員提供更為合理的安全輔助建議。例如,在大霧天氣和濕滑路況下,系統(tǒng)能夠根據(jù)前方車輛的燈光信號、車速以及路面狀態(tài),提出合理的駕駛策略與建議,減少潛在的駕駛或行車風(fēng)險。

在 AI 眼鏡與 XR 3D 空間計算頭顯方向,ArcMuse 2025明顯提升了對復(fù)雜環(huán)境下物體識別的精度,尤其是在圖像語義分割和物體關(guān)系的理解上。在應(yīng)用中,ArcMuse 2025能夠更加精確地區(qū)分復(fù)雜環(huán)境中的物體和背景,減少誤識別的情況。例如,在對圖像中的窗戶與畫作進(jìn)行區(qū)分時,ArcMuse 2025 通過優(yōu)化圖像分析流程,有效避免了誤識別,提高了識別的準(zhǔn)確度。

在智能商拍方向,ArcMuse 2025利用內(nèi)部新迭代的蒸餾框架優(yōu)化了文本與圖像生成的控制精度,使得在提示詞響應(yīng)的準(zhǔn)確性和圖像生成的可靠性方面有更高的提升。升級后的ArcMuse有更強的文本與圖像的匹配能力,能夠更好地生成符合商業(yè)需求的圖像。

在智能機器人方向,ArcMuse 2025通過優(yōu)化多模態(tài)數(shù)據(jù)處理、實時目標(biāo)識別、復(fù)雜場景理解等可顯著提升機器人在動態(tài)環(huán)境中的適應(yīng)性和自主性。同時,針對端側(cè)部署深度優(yōu)化,可使其在有限算力下依然高效運行 AI 任務(wù),助力其在工業(yè)自動化、智能服務(wù)、家庭陪護(hù)、教育娛樂等應(yīng)用落地。

視覺大模型實用化:多AI協(xié)同,驅(qū)動創(chuàng)新落地

虹軟的視覺AI技術(shù)研發(fā)經(jīng)歷了20多年的歷練,絕大多數(shù)技術(shù)都實現(xiàn)了產(chǎn)品化應(yīng)用和實際落地,達(dá)到了100億級端側(cè)設(shè)備的實際應(yīng)用。虹軟的AI研發(fā)經(jīng)歷了從CV&CG到淺層學(xué)習(xí),從端側(cè)深度學(xué)習(xí)到復(fù)雜模型,從底座模型強化到領(lǐng)域大模型;效果和性能、功耗3指標(biāo)并舉的多階段扎實迭代向前演進(jìn)。

在當(dāng)下的AI技術(shù)快速發(fā)展浪潮中,大模型成為行業(yè)關(guān)注的焦點,近來DeepSeek又帶來一波強化劑。虹軟認(rèn)為真正高效的智能計算體系不是單一的通識大模型,每個AI引擎有各自的效果和性能優(yōu)缺點,須深度耦合、效果性能權(quán)衡,這樣才能幫助視覺大模型真正快速落地實用化。

另外,一個非常有意義的目標(biāo)是:“大模型普及與可商業(yè)化”。其核心是算力要求要盡可能低,存儲資源要盡可能少,數(shù)據(jù)要求要盡可能少,成本盡可能省,但效果盡可能好。這樣的話,多AI范式的高度耦合,且是動態(tài)多層次的AI計算架構(gòu),才是邏輯合理的選擇,僅靠目前單一的視覺大模型還不夠、走不通,這就是ArcMuse的架構(gòu)思路和定位。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 視覺
    +關(guān)注

    關(guān)注

    1

    文章

    163

    瀏覽量

    24358
  • 虹軟
    +關(guān)注

    關(guān)注

    1

    文章

    60

    瀏覽量

    4613
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3134

    瀏覽量

    4053

原文標(biāo)題:虹軟新一代視覺大模型ArcMuse 2025 V1.1正式發(fā)布,全面賦能手機、汽車、眼鏡、機器人、服裝智造和智能商拍行業(yè)

文章出處:【微信號:ArcSoft_World_Wide,微信公眾號:虹軟】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    谷歌新一代生成式AI媒體模型登陸Vertex AI平臺

    我們在 Vertex AI 上推出新一代生成式 AI 媒體模型: Imagen 4、Veo 3 和 Lyria 2。
    的頭像 發(fā)表于 06-18 09:56 ?341次閱讀

    展會回顧 | 賦能新一代工業(yè)網(wǎng)絡(luò)!2025華南工博會圓滿落幕

    6月4-6日,為期3天的2025華南國際工業(yè)博覽會SCIIF在深圳國際會展中心(寶安)盛大舉行。此次參展,科全方位展示了在工業(yè)領(lǐng)域的最新成果和解決方案,包括符合新一代CAN總線標(biāo)準(zhǔn)的CANXL協(xié)議
    的頭像 發(fā)表于 06-11 17:32 ?470次閱讀
    展會回顧 | 賦能<b class='flag-5'>新一代</b>工業(yè)網(wǎng)絡(luò)!<b class='flag-5'>虹</b>科<b class='flag-5'>2025</b>華南工博會圓滿落幕

    科而美正式推出新一代RDM線條燈

    在照明技術(shù)快速迭代的今天,科而美正式推出新一代RDM線條燈,以顛覆性的技術(shù)突破重新定義行業(yè)標(biāo)準(zhǔn)!
    的頭像 發(fā)表于 06-11 15:41 ?392次閱讀

    助力路虎全新一代Defender衛(wèi)士系列上市

    近期,全球知名豪華汽車品牌路虎正式宣布全新一代Defender衛(wèi)士系列在英國市場率先上市。作為服務(wù)于該車型生態(tài)體系的智能視覺AI技術(shù)提供方之,
    的頭像 發(fā)表于 06-05 17:34 ?323次閱讀

    SEGGER推出新一代Flasher ATE在線編程器

    2025年5月,SEGGER推出新一代的Flasher ATE在線編程器Flasher ATE2。該設(shè)備的外形緊湊,可以安裝在機架上或直接安裝在ATE設(shè)備上。
    的頭像 發(fā)表于 05-12 14:21 ?336次閱讀

    科技亮相2025上海車展

    2025年4月23日至5月2日,多項智能汽車視覺核心技術(shù)參考設(shè)計及軟件方案亮相上海國際車展,分別在歐冶、舜宇、長江三大生態(tài)合作伙伴展臺同步展出。
    的頭像 發(fā)表于 04-25 14:47 ?556次閱讀

    聯(lián)合推出新一代全語言交互式人社服務(wù)機器人“南小寧”

    日前,東與南寧智慧人社創(chuàng)新實驗室以及華為攜手,共同推出新一代全語言交互式人社服務(wù)機器人——“南小寧”。它是基于東“融智”解決方案智能化實施框架,適配DeepSeek推理模型,并結(jié)合
    的頭像 發(fā)表于 03-25 10:04 ?506次閱讀

    睿創(chuàng)微納推出新一代目標(biāo)檢測算法

    隨著AI技術(shù)的發(fā)展,目標(biāo)檢測算法也迎來重大突破。睿創(chuàng)微納作為熱成像領(lǐng)軍者,憑借深厚的技術(shù)積累與創(chuàng)新能力,結(jié)合AI技術(shù)推出新一代目標(biāo)檢測算法,以三大核心技術(shù)帶來AI視覺感知全場景解決方案突破,助力各產(chǎn)業(yè)智能化升級。
    的頭像 發(fā)表于 03-20 13:49 ?421次閱讀

    AI視覺賦能雷鳥V3 AI拍攝眼鏡發(fā)布

    近日,雷鳥創(chuàng)新正式發(fā)布全新一代AI拍攝眼鏡——雷鳥V3。該產(chǎn)品搭載多項創(chuàng)新技術(shù),包括融合AI視覺算法的獵鷹影像系統(tǒng)、通義獨家定制大
    的頭像 發(fā)表于 01-08 10:58 ?1120次閱讀

    Garmin佳明和天馬推出新一代數(shù)字座艙解決方案

    在即將開幕的國際消費電子展(CES 2025)上,Garmin佳明推出新一代數(shù)字座艙解決方案Garmin Unified Cabin 2025。該方案配備了天馬多款車規(guī)級顯示屏,其中
    的頭像 發(fā)表于 01-07 16:16 ?860次閱讀

    Garmin佳明和高通推出新一代數(shù)字座艙解決方案

    Garmin佳明和高通技術(shù)公司在2025年國際消費電子展(CES 2025)上宣布,雙方將擴展在汽車技術(shù)領(lǐng)域的合作,推出新一代數(shù)字座艙解決方案Garmin Unified Cabin
    的頭像 發(fā)表于 01-07 10:38 ?767次閱讀

    ArcMuse計算技術(shù)引擎全面升級

    經(jīng)過半年多的潛心研發(fā)和技術(shù)攻關(guān),ArcMuse計算技術(shù)引擎迎來全面升級,實現(xiàn)多項關(guān)鍵技術(shù)突破。升級內(nèi)容涵蓋高清視頻生成、AI模特圖高精度生成、智能試衣和平鋪圖生成等領(lǐng)域,有效攻克了商拍領(lǐng)域中的諸多核心難點。
    的頭像 發(fā)表于 12-11 17:34 ?780次閱讀

    比亞迪2025年將推出新一代刀片電池

    比亞迪公司近日宣布,公司計劃在2025推出新一代刀片電池。這舉措旨在顯著提升電動汽車的續(xù)航能力和電池壽命,進(jìn)步推動電動汽車技術(shù)的發(fā)展
    的頭像 發(fā)表于 11-26 10:49 ?2030次閱讀

    DeepL推出新一代翻譯編輯大型語言模型

    在人工智能與語言處理領(lǐng)域,DeepL再次以其創(chuàng)新實力引領(lǐng)潮流,宣布成功推出新一代面向翻譯與編輯應(yīng)用的大型語言模型。這里程碑式的進(jìn)展,不僅鞏固了DeepL作為頂尖語言人工智能公司的地位,更標(biāo)志著機器翻譯技術(shù)向更高質(zhì)量、更智能化方
    的頭像 發(fā)表于 07-19 15:56 ?1011次閱讀

    Nullmax正式推出新一代自動駕駛技術(shù)Nullmax Intelligence

    7月16日,Nullmax在上海舉辦“AI無止境,智變新開端”2024技術(shù)發(fā)布會,正式推出新一代自動駕駛技術(shù)Nullmax Intelligence(簡稱“NI”)。新技術(shù)著重于打造全場景的自動駕駛應(yīng)用,以純視覺、真無圖、多模態(tài)的技術(shù)特點,助力汽車智能進(jìn)化。
    的頭像 發(fā)表于 07-17 09:32 ?960次閱讀
    Nullmax正式<b class='flag-5'>推出新一代</b>自動駕駛技術(shù)Nullmax Intelligence