來源:聚大模型前言
在 Hot Chips 2024 上,IBM 宣布了其下一代大型機技術(shù),其中包括 Telum II 處理器和 Spyre AI 加速器。這兩款產(chǎn)品將顯著提高 IBM Z 系統(tǒng)上的 AI 功能,滿足企業(yè)對高效、安全和可擴展 AI 解決方案的需求。
IBM Telum II 處理器是 IBM z16 的核心,集成了深度學習推理能力,通過硬件直接集成了 AI 加速功能,企業(yè)在無需額外硬件的情況下,即可實現(xiàn)實時數(shù)據(jù)分析和決策制定。Telum II 處理器的 AI 加速計算能力比上代 Telum 處理器提升四倍,并且通過一致性連接的處理集群,進一步提升了性能。
Telum II 處理器通過增加 L2、L3 和 L4 緩存的大小,緩存容量較上代增加了 40%,顯著改善了芯片外帶寬和延遲性能。此外,Telum II 處理器的時鐘頻率達到 5.5 GHz ,可以提供更快的處理速度。Telum II 還增加了用于 I/O 加速的新數(shù)據(jù)處理單元 (DPU)。該單元可以提高數(shù)據(jù)處理效率,I/O 密度提高 50%。DPU 可以簡化系統(tǒng)操作并提高數(shù)據(jù)密集型應(yīng)用程序和人工智能工作負載的性能。
安全性方面,Telum II 處理器支持包括量子安全加密在內(nèi)的高級加密技術(shù)。此外,Telum II 處理器在 A 和 Z 總線鏈接上提供了改進的安全性能,進一步保護了企業(yè)的數(shù)據(jù)安全。能效方面, Telum II 處理器通過優(yōu)化功率消耗,有效降低了 IBM z16 的能源消耗?;诩惺?IO 和 DPU 設(shè)計,Telum II 降低了高達 15% 的核心功率,進一步提高了能源效率。
與 Telum II 處理器一同推出的還有 IBM Spyre AI 加速器。Spyre 加速器擁有 32 個獨立的加速器核心,并且包含 25.6 億個晶體管,支持 int4、int8、fp8 和 fp16 數(shù)據(jù)類型,使用 5 納米工藝生產(chǎn)。每個 Spyre 加速器都安裝在 PCIe 卡上,這些卡可以集群化,為單個 IBM Z 系統(tǒng)增加大量的加速器核心。
Spyre 加速器支持在本地進行生成式 AI 和模型微調(diào),使 IBM Z 系統(tǒng)能夠處理更復(fù)雜的 AI 工作負載。Spyre 加速器的架構(gòu)可以直接將數(shù)據(jù)從一個計算引擎發(fā)送到下一個,從而節(jié)省了能源。此外,Spyre 加速器使用一系列較低精度的數(shù)值格式,如 int4 和 int8,這使得運行 AI 模型更加節(jié)能且對內(nèi)存的需求更少。
Telum II 處理器和 Spyre AI 加速器的結(jié)合,企業(yè)用戶能夠直接在 Z 平臺上安全高效地運行人工智能應(yīng)用程序。Telum II 可以處理大規(guī)模 AI 工作負載和數(shù)據(jù)密集型業(yè)務(wù)需求,而 Spyre 加速器可以處理復(fù)雜的 AI 模型和生成式 AI 用例,所有這些都不會影響 IBM Z 環(huán)境的安全性和可靠性。
Telum II處理器和Spyre加速器都將采用三星代工廠的5納米工藝技術(shù)制造。預(yù)計這些產(chǎn)品將于 2025 年向客戶提供。
【近期會議】
10月30-31日,由寬禁帶半導(dǎo)體國家工程研究中心主辦的“化合物半導(dǎo)體先進技術(shù)及應(yīng)用大會”將首次與大家在江蘇·常州相見,邀您齊聚常州新城希爾頓酒店,解耦產(chǎn)業(yè)鏈市場布局!https://w.lwc.cn/s/uueAru
11月28-29日,“第二屆半導(dǎo)體先進封測產(chǎn)業(yè)技術(shù)創(chuàng)新大會”將再次與各位相見于廈門,秉承“延續(xù)去年,創(chuàng)新今年”的思想,仍將由云天半導(dǎo)體與廈門大學聯(lián)合主辦,雅時國際商訊承辦,邀您齊聚廈門·海滄融信華邑酒店共探行業(yè)發(fā)展!誠邀您報名參會:https://w.lwc.cn/s/n6FFne
聲明:本網(wǎng)站部分文章轉(zhuǎn)載自網(wǎng)絡(luò),轉(zhuǎn)發(fā)僅為更大范圍傳播。 轉(zhuǎn)載文章版權(quán)歸原作者所有,如有異議,請聯(lián)系我們修改或刪除。聯(lián)系郵箱:viviz@actintl.com.hk, 電話:0755-25988573
審核編輯 黃宇
-
處理器
+關(guān)注
關(guān)注
68文章
19890瀏覽量
235124 -
IBM
+關(guān)注
關(guān)注
3文章
1821瀏覽量
75812 -
AI
+關(guān)注
關(guān)注
88文章
35109瀏覽量
279600 -
人工智能
+關(guān)注
關(guān)注
1806文章
49011瀏覽量
249356
發(fā)布評論請先 登錄
開售RK3576 高性能人工智能主板
TPU處理器的特性和工作原理

IBM推出新一代大型主機IBM z17
端側(cè) AI 音頻處理器:集成音頻處理與 AI 計算能力的創(chuàng)新芯片
Banana Pi 攜手 ArmSoM 推出人工智能加速 RK3576 CM5 計算模塊
IBM與AMD攜手部署MI300X加速器,強化AI與HPC能力
IBM與AMD攜手將在IBM云上部署AMD Instinct MI300X加速器
微軟攜手英偉達與GitHub推出生成式AI加速器
AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感
《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得
Samtec AI 應(yīng)用詳述 | 人工智能加速器所需的連接器

評論