99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

1.5T內存挑戰(zhàn)英偉達!8枚芯片撐起3個GPT-4,華人AI芯片獨角獸估值365億

傳感器技術 ? 來源:量子位 ? 2023-09-23 10:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

高端GPU持續(xù)缺貨之下,一家要挑戰(zhàn)英偉達的芯片初創(chuàng)公司成為行業(yè)熱議焦點。

8枚芯片跑大模型,就能支持5萬億參數(shù)(GPT-4的三倍)。

這是獨角獸企業(yè)SambaNova剛剛發(fā)布的新型AI芯片SN40L——

型號中40代表是他們第四代產品,L代表專為大模型(LLM)優(yōu)化:高達1.5T的內存,支持25.6萬個token的序列長度。

CEORodrigo Liang表示,當前行業(yè)標準做法下運行萬億參數(shù)大模型需要數(shù)百枚芯片,我們的方法使總擁有成本只有標準方法的1/25。

SambaNova目前估值50億美元(約365億人民幣),累計完成了6輪總計11億美元的融資,投資方包括英特爾、軟銀、三星、GV等。

他們不僅在芯片上要挑戰(zhàn)英偉達,業(yè)務模式上也說要比英偉達走的更遠:直接參與幫助企業(yè)訓練私有大模型。

目標客戶上野心更是很大:瞄準世界上最大的2000家企業(yè)。

1.5TB內存的AI芯片

最新產品SN40L,由臺積電5納米工藝制造,包含1020億晶體管,峰值速度638TeraFLOPS。

與英偉達等其他AI芯片更大的不同在于新的三層Dataflow內存系統(tǒng)。

520MB片上SRAM內存

65GB的高帶寬HBM3內存

以及高達1.5TB的外部DRAM內存

831e8822-599c-11ee-939d-92fbcf53809c.png

與主要競品相比,英偉達H100最高擁有80GB HBM3內存,AMD MI300擁有192GB HBM3內存。

SN40L的高帶寬HBM3內存實際比前兩者小,更多依靠大容量DRAM。

Rodrigo Liang表示,雖然DRAM速度更慢,但專用的軟件編譯器可以智能地分配三個內存層之間的負載,還允許編譯器將8個芯片視為單個系統(tǒng)。

83257e16-599c-11ee-939d-92fbcf53809c.png

除了硬件指標,SN40L針對大模型做的優(yōu)化還有同時提供密集和稀疏計算加速。

他們認為大模型中許多權重設置為0,像其他數(shù)據(jù)一樣去執(zhí)行操作很浪費。

他們找到一種軟件層面的加速辦法,與調度和數(shù)據(jù)傳輸有關,但沒有透露細節(jié),“我們還沒準備好向公布是如何做到這一點的”。

咨詢機構Gartner的分析師Chirag Dekate認為,SN40L的一個可能優(yōu)勢在于多模態(tài)AI。

GPU的架構非常嚴格,面對圖像、視頻、文本等多樣數(shù)據(jù)時可能不夠靈活,而SambaNova可以調整硬件來滿足工作負載的要求。

目前,SambaNova的芯片和系統(tǒng)已獲得不少大型客戶,包括世界排名前列的超算實驗室,日本富岳、美國阿貢國家實驗室、勞倫斯國家實驗室,以及咨詢公司埃森哲等。

業(yè)務模式也比較特別,芯片不單賣,而是出售其定制技術堆棧,從芯片到服務器系統(tǒng),甚至包括部署大模型。

為此,他們與TogetherML聯(lián)合開發(fā)了BloomChat,一個1760億參數(shù)的多語言聊天大模型。

BloomChat建立在BigScience組織的開源大模型Bloom之上,并在來自OpenChatKit、Dolly 2.0和OASST1的OIG上進行了微調。

訓練過程中,它使用了SambaNova獨特的可重配置數(shù)據(jù)流架構,然后在SambaNova DataScale系統(tǒng)進行訓練。

8345a0ce-599c-11ee-939d-92fbcf53809c.png

這也是這家公司最大被投資者熱捧之外的最大爭議點之一,很多人不看好一家公司既做芯片又做大模型。

給每家大企業(yè)打造150個大模型

在與The Next Platform網(wǎng)站交流時,CEO Rodrigo Liang表示:

用于大模型訓練的公開數(shù)據(jù)已快耗盡,但對參數(shù)數(shù)量的追求還在不斷增加。

各種大模型的性能相差只有幾個百分點,這不是大家應該玩的游戲。

他認為大模型與生成式AI商業(yè)化的下一個戰(zhàn)場是企業(yè)的私有數(shù)據(jù),尤其是大企業(yè)。

這些企業(yè)坐擁大量的數(shù)據(jù),但自己不知道其中大部分內容是什么。

834f900c-599c-11ee-939d-92fbcf53809c.png

對于企業(yè)私有大模型的形態(tài),SambaNova也有與眾不同的觀點。

他們認為最終企業(yè)內部不會運行一個GPT-4或谷歌Gemini那樣的超大模型,而是根據(jù)不同數(shù)據(jù)子集創(chuàng)建150個獨特的模型,聚合參數(shù)超過萬億。

相當于把GPT-4等大模型內部的Mixture of Experts(專家混合)架構擴展到整個系統(tǒng),稱為Composition of Experts(專家合成)。

在企業(yè)運轉的每個節(jié)點運行一個完整且經(jīng)過專門調整的基礎模型,分別用法律語料庫、制造語料庫、風險管理語料庫、財富管理語料庫、客戶銷售語料庫、客戶支持語料庫等等不同數(shù)據(jù)訓練。

這些專家模型之間通過一種軟件路由或負載平衡器聯(lián)在一起,收到推理請求后決定具體向哪個模型推送提示詞。

這一策略與GPT-4和谷歌Gemini等做法形成鮮明對比,巨頭大多希望創(chuàng)建一個能泛化到數(shù)百萬個任務的巨型模型。

分析師認為技術上可能谷歌的做法性能更強,但SambaNova的方法對企業(yè)來說更實用。

沒有任何一個模型或人能完整訪問企業(yè)的所有數(shù)據(jù),限制每個部門能訪問的專家模型,就能限制他們能訪問的數(shù)據(jù)。

斯坦福系芯片公司,華人工程師主力

SambaNova成立于2017年,2020年之前都比較低調。

聯(lián)創(chuàng)3人都是斯坦福背景,連產品系列名Cardinal(深紅色)都是斯坦福的昵稱與代表顏色。

CEO Rodrigo Liang是前Sun/甲骨文工程副總裁,也有人將這個名字解讀為暗指甲骨文老對頭IBM的DeepBlue(深藍)。

另外兩位聯(lián)合創(chuàng)始人都是斯坦福教授。

CTOKunle Olukotun是電氣工程教授,因多核芯片架構方面的研究而聞名,開發(fā)了首批支持線程級推測 (TLS) 的芯片之一。

Christopher Ré是計算機科學副教授,重點研究方向機器學習和數(shù)據(jù)分析的速度和可擴展性。

此外團隊中還有不少華人工程師。

從官網(wǎng)公開信息來看,SambaNova的領導團隊中,至少有3名華人。

Jonathan Chang,擁有UC伯克利的機械工程學士學位以及南加州大學的MBA學位。

他在構建高增長方面擁有20多年的經(jīng)驗。加入SambaNova之前,Chang在特斯拉工作了近9年。

Marshall Choy,此前曾擔任甲骨文公司系統(tǒng)產品管理和解決方案開發(fā)副總裁,監(jiān)督了數(shù)十個行業(yè)的企業(yè)硬件和軟件產品的上市。

Penny Li,在EDA工具微處理器設計方面擁有超過27年的經(jīng)驗。此前,她曾在IBM和甲骨文工作過。

如果去領英搜索還能發(fā)現(xiàn)更多華人團隊成員。

目前SambaNova包含SN40L芯片的人工智能引擎已上市,但定價沒有公開。

根據(jù)Rodrigo Liang的說法,8個SN40L組成的集群總共可處理5萬億參數(shù),相當于70個700億參數(shù)大模型。

全球2000強的企業(yè)只需購買兩個這樣的8芯片集群,就能滿足所有大模型需求。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4948

    瀏覽量

    131246
  • 英偉達
    +關注

    關注

    22

    文章

    3953

    瀏覽量

    93788
  • AI芯片
    +關注

    關注

    17

    文章

    1983

    瀏覽量

    35915

原文標題:1.5T內存挑戰(zhàn)英偉達!8枚芯片撐起3個GPT-4,華人AI芯片獨角獸估值365億

文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    宇樹科技王興興的對手Figure2900 成立于2022年的硅谷具身智能獨角獸

    王興興的宇樹科技開創(chuàng)了全球低成本高性能足式機器人的技術先河,春晚亮相的人形機器人更是驚艷全球,這一賽道也吸引了更多人加入,F(xiàn)igure這家成立于2022年的硅谷具身智能獨角獸高達2900
    的頭像 發(fā)表于 04-08 11:32 ?902次閱讀

    鑄科技榮登2024創(chuàng)業(yè)邦100未來獨角獸榜單

    在第16屆創(chuàng)業(yè)邦100未來獨角獸峰會上,鑄科技以其在AI大算力芯片領域的杰出成就和巨大潛力,榮登“2024創(chuàng)業(yè)邦100未來獨角獸”榜單。這
    的頭像 發(fā)表于 12-28 15:49 ?907次閱讀

    匯頂科技擬并購芯片獨角獸云英谷

    近日,半導體領域再次發(fā)生一起引人注目的并購事件。國內知名芯片企業(yè)匯頂科技宣布,計劃通過發(fā)行股份及支付現(xiàn)金的方式,收購芯片獨角獸云英谷的控制權。
    的頭像 發(fā)表于 12-03 12:59 ?901次閱讀

    Tenstorrent獲7美元融資,貝索斯參投挑戰(zhàn)英偉

    AI芯片初創(chuàng)公司Tenstorrent近日宣布獲得高達7美元的融資,公司也隨之攀升至26
    的頭像 發(fā)表于 12-03 11:07 ?775次閱讀

    英偉加速認證三星AI內存芯片

    近日,英偉公司正在積極推進對三星AI內存芯片的認證工作。據(jù)英偉
    的頭像 發(fā)表于 11-25 14:34 ?596次閱讀

    鑄科技榮登中國潛在獨角獸企業(yè)榜單

    在近日舉辦的“2024中國潛在獨角獸企業(yè)發(fā)展大會”上,長城戰(zhàn)略咨詢隆重發(fā)布了《GEI中國潛在獨角獸企業(yè)研究報告2024》,深度剖析了中國潛在獨角獸企業(yè)的最新發(fā)展動態(tài)。該報告連續(xù)第五年發(fā)布,
    的頭像 發(fā)表于 11-18 10:12 ?1087次閱讀

    主線科技榮登中國潛在獨角獸企業(yè)榜單

    日前,長城咨詢重磅發(fā)布2024年GEI中國潛在獨角獸企業(yè)榜單及研究報告。主線科技憑借卓越的技術硬實力、前瞻性的市場布局以及持續(xù)的創(chuàng)新活力,從眾多競爭者中脫穎而出,榮獲“潛在獨角獸”稱號。中國潛在
    的頭像 發(fā)表于 11-12 17:17 ?1092次閱讀

    連續(xù)3年!路凱智行榮登中國潛在獨角獸榜單

    超過十年,獲得過私募投資,且尚未上市,最近一輪融資的投后超過(含)10美元的企業(yè)。潛在獨角獸企業(yè)則一般是獲得過私募投資,且尚未上市,成立5年之內,最新一輪融資
    的頭像 發(fā)表于 11-04 13:32 ?657次閱讀
    連續(xù)<b class='flag-5'>3</b>年!路凱智行榮登中國潛在<b class='flag-5'>獨角獸</b>榜單

    潤芯微科技榮獲中國潛在獨角獸企業(yè)

    近日,長城戰(zhàn)略咨詢在2024東北亞(沈陽)人才交流大會暨中國潛在獨角獸企業(yè)發(fā)展大會上揭曉了“中國潛在獨角獸企業(yè)榜單”,潤芯微科技(江蘇)有限公司憑借卓越的創(chuàng)新能力和快速發(fā)展勢頭,成功入選該榜單。此前
    的頭像 發(fā)表于 10-29 14:39 ?1181次閱讀

    長沙“獨角獸”創(chuàng)新弄潮兒 長沙4家企業(yè)成為潛在獨角獸企業(yè)

    2024》顯示有4家長沙企業(yè)上榜?,分別是三頓半、中科星城、楚微半導體、盈芯半導體。 前不久長城戰(zhàn)略咨詢發(fā)布的《中國獨角獸企業(yè)研究報告2024》數(shù)據(jù)顯示長沙擁有9家獨角獸企業(yè)。分別是興盛優(yōu)選、茶顏悅色、三一重卡、天鵝到家、中偉新
    的頭像 發(fā)表于 10-28 14:24 ?1146次閱讀

    AI芯片獨角獸壁仞科技啟動上市輔導

    近日,備受矚目的AI芯片獨角獸企業(yè)——上海壁仞科技股份有限公司正式在上海證監(jiān)局完成輔導備案登記,標志著其向首次公開發(fā)行股票并上市的目標邁出了堅實的一步。此次輔導券商選定為國泰君安,彰顯了市場對壁仞科技未來發(fā)展前景的廣泛認可與期待
    的頭像 發(fā)表于 09-12 17:35 ?1096次閱讀

    AI芯片巨頭英偉漲超4% 英偉市值暴增7500

    行業(yè)股票開始反彈,那么英偉公司的股票將是不錯的選擇。還有瑞穗證券(Mizuho)也認為英偉公司的股價仍有很大的上漲空間。 ? ? ?美
    的頭像 發(fā)表于 08-13 15:33 ?1451次閱讀

    消息稱谷歌25美元收購AI獨角獸Character.AI

    近日,科技界傳來重磅消息,谷歌宣布成功收購人工智能獨角獸公司Character.AI,標志著雙方在AI領域的合作邁入新階段。此次收購不僅吸引了業(yè)界的廣泛關注,也再次凸顯了大型科技公司在AI
    的頭像 發(fā)表于 08-05 18:09 ?1336次閱讀

    370!傳感器應用端獨角獸迎來IPO

    資本、英偉、德昌電機、啟明創(chuàng)投、創(chuàng)新工場、國開金融、國調基金、凱雷、China-UAE Fund(中阿基金)、IDG資本、CMC資本、基石資本、沈向洋和何小鵬等手中拿到超過12美元(約87
    的頭像 發(fā)表于 08-02 10:03 ?585次閱讀

    160,背靠國產傳感器首富,浙江誕生中國唯一民營晶圓代工獨角獸

    此前,胡潤研究院發(fā)布《2024全球獨角獸榜》,列出了全球成立于2000年之后,價值10美元以上的非上市公司。 ? 其中,來自浙江寧波的晶圓制造企業(yè)——榮芯半導體,160
    的頭像 發(fā)表于 08-02 08:44 ?6463次閱讀
    <b class='flag-5'>估</b><b class='flag-5'>值</b>160<b class='flag-5'>億</b>,背靠國產傳感器首富,浙江誕生中國唯一民營晶圓代工<b class='flag-5'>獨角獸</b>