99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型快速發(fā)展,GPU IP有何作用

Carol Li ? 來源:電子發(fā)燒友 ? 作者:李彎彎 ? 2024-05-29 00:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


電子發(fā)燒友網(wǎng)報道(文/李彎彎)隨著人工智能技術(shù)的快速發(fā)展,GPU作為重要的算力支撐時常被提及。國內(nèi)外重要的GPU芯片公司也為人熟知,包括英偉達、AMD、英特爾,景嘉微、海光信息、天數(shù)智芯、摩爾線程等。

事實上,除此之外還有一些GPU IP公司也為GPU產(chǎn)業(yè)發(fā)展做出很大貢獻,包括Imagination、Arm、芯原科技等。在當前備受關(guān)注的大模型方面,這些公司的產(chǎn)品也起到一定支持作用。

Imagination

Imagination的GPU IP產(chǎn)品包括IMG A系列、IMG CXT、IMG DXT等多個系列,每個系列有不同的特點和應(yīng)用場景。IMG A系列,是Imagination有史以來性能最強大GPU IP產(chǎn)品,IMG A系列被設(shè)計為可應(yīng)用于與各種場景的GPU,是多種垂直應(yīng)用領(lǐng)域的終極解決方案。

該系列產(chǎn)品覆蓋從入門級市場的每時鐘周期處理1個像素(1 PPC)的組件,到高性能設(shè)備的速度高達每秒2萬億次浮點運算(2 TFLOP)的內(nèi)核,以及針對云應(yīng)用的、速度超越該數(shù)值的多核解決方案。

IMG CXT,搭載首個針對移動端優(yōu)化的PowerVR Photon光線追蹤架構(gòu),為移動端游戲玩家和開發(fā)者提供桌面級光線追蹤功能的體驗。實現(xiàn)了光線追蹤性能的大幅提升,支持在移動設(shè)備中以高幀率實現(xiàn)逼真的光線追蹤陰影、反射、全局照明和環(huán)境遮蔽等效果。

IMG DXT是新一代面向移動端的高性能GPU IP,為移動設(shè)備用戶帶來先進的圖形技術(shù)。提供三款配置,包括DXT-8-256、DXT-48-1536和DXT-72-2304,分別針對主流、高端和旗艦移動設(shè)備。旗艦產(chǎn)品DXT-72-2304具有72 GTexels/s和2.5 TFLOP FP32算力,與上一代產(chǎn)品相比,其最大單核性能提升了50%。

Imagination的GPU IP產(chǎn)品廣泛應(yīng)用于移動設(shè)備、汽車、數(shù)據(jù)中心、桌面和云游戲等多個領(lǐng)域。通過提供高性能的圖形渲染和數(shù)據(jù)處理能力,為各種應(yīng)用場景提供了強大的支持。

Imagination的GPU IP高性能、可擴展性和低功耗的特性,使得在支持大模型的應(yīng)用上具有優(yōu)勢。如IMG DXD,其多核配置提供了強大的計算能力,5 TFLOPS FP32和144 GTexel/s,能夠在大模型的應(yīng)用上起到支持作用。

Arm

Arm的GPU IP產(chǎn)品系列主要包括Mali系列和Immortalis系列。Mali系列GPU IP是Arm的長期主力產(chǎn)品,擁有從入門級到旗艦級的完整產(chǎn)品線。Mali系列包括Mali-G710、Mali-G610、Mali-G510、Mali-G310等多個型號,分別定位于不同性能和價格的市場段。

Mali系列GPU基于Valhall GPU架構(gòu),并持續(xù)優(yōu)化和提升性能。例如,Mali-G710號稱綜合性能提升20%、機器學(xué)習(xí)性能提升35%、紋理性能提升50%、能效提升20%。

Immortalis系列是Arm在2022年推出的全新旗艦級GPU IP產(chǎn)品,旨在提供終極的移動3D體驗。Immortalis GPU基于Mali設(shè)計,并引入了硬件光線追蹤功能,這是首款在移動端支持此功能的GPU。

Immortalis GPU采用10-16核設(shè)計,性能比上一代Mali GPU高15%。其光線追蹤單元旨在提高效率,只占用約4%的著色器核心面積,卻能帶來300%的性能提升。

目前,Immortalis系列已經(jīng)推出了Immortalis-G715和Immortalis-G720等型號。Immortalis-G720是Arm目前性能和能效表現(xiàn)最為出色的GPU,與上一代產(chǎn)品相比,其性能和能效分別提高了15%,系統(tǒng)級效率更躍升了40%。

Arm的GPU IP產(chǎn)品廣泛應(yīng)用于移動設(shè)備、汽車、數(shù)據(jù)中心、桌面和云游戲等多個領(lǐng)域。它們能夠支持各種計算任務(wù),如圖形渲染、物理模擬、圖像處理、機器學(xué)習(xí)和人工智能等。

Arm的GPU IP高性能計算、能效優(yōu)化和生態(tài)系統(tǒng)支持方面特點,使其在大模型的應(yīng)用方面具有優(yōu)勢。Arm的GPU IP,如Mali系列和Ethos系列,已被多家公司采用,并成功應(yīng)用于大模型訓(xùn)練和推理中。

在大模型訓(xùn)練方面,Arm的GPU IP被廣泛應(yīng)用于深度學(xué)習(xí)、自然語言處理等領(lǐng)域。通過與合作伙伴共同開發(fā)定制化的解決方案,Arm GPU IP為這些領(lǐng)域的研究者和開發(fā)者提供了強大的計算能力支持。

在云端推理方面,Arm的GPU IP同樣發(fā)揮了重要作用。通過提供高性能的云端計算資源,Arm GPU IP支持了多種大模型應(yīng)用的實時推理需求。

芯原股份

芯原股份的GPU IP系列產(chǎn)品,以其高性能、靈活性和廣泛的應(yīng)用范圍,成為市場上備受矚目的產(chǎn)品。芯原可擴展的Vivante圖形處理器(GPU)IP系列應(yīng)用廣泛,包括從低功耗的小型物聯(lián)網(wǎng)MCU到面向汽車和計算機應(yīng)用的功能強大的SoC。設(shè)計可滿足各種芯片尺寸和功耗預(yù)算,是具成本效益的優(yōu)質(zhì)圖形處理器解決方案。

芯原科技此前還詳細介紹了其GPGPU-AI IP為核心的AI芯片定制解決方案。其以Tensor Core和GPGPU/GPU為主,提供了一個靈活的架構(gòu)。

芯原GPGPU-AI處理器上有芯原通用的軟件棧,在上層可以支持標準的應(yīng)用接口,下層可以適配芯原各種各樣的算力IP,算力IP有圖形處理器、并行計算處理器、神經(jīng)網(wǎng)絡(luò)處理器。芯原GPGPU-AI分幾個層次擴展的算力,可以支持異構(gòu)計算,包括矢量計算、標量計算和張量處理單元,還可以支持大模型,高帶寬計算需求,同時基于在AI領(lǐng)域有多年的積累,可對數(shù)據(jù)組織、數(shù)據(jù)搬移和計算有針對性的優(yōu)化,另外還有專門針對大模型的帶寬壓縮技術(shù)。

芯原的GPU IP已被廣泛應(yīng)用于桌面顯卡、車載信息娛樂、工業(yè)顯示、物聯(lián)網(wǎng)及可穿戴設(shè)備、大規(guī)模并行計算等領(lǐng)域。

寫在最后


可以看到,GPU IP在多個領(lǐng)域都有廣泛應(yīng)用,包括科學(xué)計算、大數(shù)據(jù)分析、深度學(xué)習(xí)和人工智能、游戲服務(wù)器、圖像處理、圖形渲染和動畫制作、視頻處理和圖像識別等。

當然,GPU IP也在不斷發(fā)展和演進中,未來,專用加速IP與通用GPU的融合或許是GPU技術(shù)未來發(fā)展的一個亮點,這種融合將使GPU更具多功能性,更好地處理特定工作負載。高速DRAM和緩存技術(shù)的不斷演進也將推動GPU的性能提升,使其能夠更有效地處理復(fù)雜的計算任務(wù),如支持大模型的訓(xùn)練和部署。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4949

    瀏覽量

    131273
  • IP
    IP
    +關(guān)注

    關(guān)注

    5

    文章

    1805

    瀏覽量

    152618
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3146

    瀏覽量

    4077
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    搭建萬卡GPU集群,小米AI大模型即將全力啟動

    董事長雷軍在該團隊扮演重要的領(lǐng)導(dǎo)角色。 ? 高性能計算是大模型發(fā)展的基礎(chǔ),而GPU在其中扮演重要作用。隨著AI在如今社會中發(fā)揮著越來越重要的作用
    的頭像 發(fā)表于 12-29 00:02 ?2935次閱讀
    搭建萬卡<b class='flag-5'>GPU</b>集群,小米AI大<b class='flag-5'>模型</b>即將全力啟動

    【VisionFive 2單板計算機試用體驗】1、開箱初體驗(刷系統(tǒng)+靜態(tài)IP設(shè)置+GPU跑分測評)

    文件:注意:balenaEtcher這個軟件表面上可以選擇bz2文件,但是在軟件內(nèi)解壓的話會卡在73%的進度。所以,bz2文件要先解壓,再用balenaEtcher燒錄鏡像到TF卡。 開機設(shè)置靜態(tài)IP
    發(fā)表于 07-09 21:50

    為什么無法在GPU上使用INT8 和 INT4量化模型獲得輸出?

    安裝OpenVINO? 2024.0 版本。 使用 optimum-intel 程序包將 whisper-large-v3 模型轉(zhuǎn)換為 int 4 和 int8,并在 GPU 上使用 OpenVINO? 運行推理。 沒有可用的輸出。
    發(fā)表于 06-23 07:11

    摩爾線程GPU率先支持Qwen3全系列模型

    近日,阿里云正式發(fā)布Qwen3系列的8款開源混合推理模型。摩爾線程團隊在模型發(fā)布當天,率先完成了Qwen3全系列模型在全功能GPU上的高效支持。這一成果充分展現(xiàn)了MUSA架構(gòu)及全功能
    的頭像 發(fā)表于 05-07 15:24 ?485次閱讀

    無法在GPU上運行ONNX模型的Benchmark_app怎么解決?

    在 CPU 和 GPU 上運行OpenVINO? 2023.0 Benchmark_app推斷的 ONNX 模型。 在 CPU 上推理成功,但在 GPU 上失敗。
    發(fā)表于 03-06 08:02

    語言模型管理的作用

    要充分發(fā)揮語言模型的潛力,有效的語言模型管理非常重要。以下,是對語言模型管理作用的分析,由AI部落小編整理。
    的頭像 發(fā)表于 01-02 11:06 ?389次閱讀

    小米加速布局AI大模型,搭建GPU萬卡集群

    近日,消息稱小米正在緊鑼密鼓地搭建自己的GPU萬卡集群,旨在加大對AI大模型的投入力度。據(jù)悉,小米的大模型團隊在成立之初就已經(jīng)擁有了6500張GP
    的頭像 發(fā)表于 12-28 14:25 ?528次閱讀

    GPU是如何訓(xùn)練AI大模型

    在AI模型的訓(xùn)練過程中,大量的計算工作集中在矩陣乘法、向量加法和激活函數(shù)等運算上。這些運算正是GPU所擅長的。接下來,AI部落小編帶您了解GPU是如何訓(xùn)練AI大模型的。
    的頭像 發(fā)表于 12-19 17:54 ?750次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    和不支持的NVIDIA GPU硬件,如支持的L40S、RTX 5000 Ada Gen等,不支持的如Kepler和Maxwell部分型號被標記為棄用。同時提到GPU計算要求64位計算機架構(gòu),不同代
    發(fā)表于 12-16 14:25

    IP定位離線庫的特點以及作用

    很多人知道IP定位,但是對離線庫不是很理解。這篇文章會和大家闡述離線庫的概念、特點以及具體什么作用。 IP定位路徑https://www.ipdatacloud.com/?utm-s
    的頭像 發(fā)表于 12-06 09:56 ?569次閱讀

    TPA3123 demo原理圖中,輸出LC濾波器個對地的電阻,請問作用?量產(chǎn)時能否去掉?

    您好,TI的TPA3123 demo原理圖中,輸出LC濾波器個對地的電阻,請問作用?量產(chǎn)時能否去掉? 見下圖中圈起部分。
    發(fā)表于 11-08 06:02

    PyTorch GPU 加速訓(xùn)練模型方法

    在深度學(xué)習(xí)領(lǐng)域,GPU加速訓(xùn)練模型已經(jīng)成為提高訓(xùn)練效率和縮短訓(xùn)練時間的重要手段。PyTorch作為一個流行的深度學(xué)習(xí)框架,提供了豐富的工具和方法來利用GPU進行模型訓(xùn)練。 1. 了解
    的頭像 發(fā)表于 11-05 17:43 ?1414次閱讀

    GPU市場趨勢與未來發(fā)展

    隨著科技的飛速發(fā)展,圖形處理單元(GPU)已經(jīng)成為現(xiàn)代計算領(lǐng)域不可或缺的一部分。從游戲到專業(yè)圖形設(shè)計,再到人工智能和深度學(xué)習(xí),GPU在各個領(lǐng)域都發(fā)揮著重要作用。
    的頭像 發(fā)表于 10-27 14:14 ?1372次閱讀

    GPU深度學(xué)習(xí)應(yīng)用案例

    GPU在深度學(xué)習(xí)中的應(yīng)用廣泛且重要,以下是一些GPU深度學(xué)習(xí)應(yīng)用案例: 一、圖像識別 圖像識別是深度學(xué)習(xí)的核心應(yīng)用領(lǐng)域之一,GPU在加速圖像識別模型訓(xùn)練方面發(fā)揮著關(guān)鍵
    的頭像 發(fā)表于 10-27 11:13 ?1384次閱讀

    為什么ai模型訓(xùn)練要用gpu

    GPU憑借其強大的并行處理能力和高效的內(nèi)存系統(tǒng),已成為AI模型訓(xùn)練不可或缺的重要工具。
    的頭像 發(fā)表于 10-24 09:39 ?980次閱讀