電子發(fā)燒友網(wǎng)報道(文/李彎彎)近段時間,由OpenAI推出的ChatGPT火遍全球,它幾乎可以生成任何形式的文本,從寫文章、編寫代碼,到回答復雜的數(shù)學問題。上線近兩個月,ChatGPT的注冊用戶就達到1億,成為史上用戶破億速度最快的軟件之一。
ChatGPT的爆火給生成式AI的應用帶來更多可能性,AI語言處理大模型也隨之進入全球角逐的新階段。在國內(nèi),百度、阿里等頭部互聯(lián)網(wǎng)企業(yè)都已經(jīng)宣布有相關的研究。那么,國內(nèi)在發(fā)展AI語言處理大模型方面是否具備相應的條件,國產(chǎn)廠商可以如何把握這個機會?
在AIGC大模型發(fā)展上,國內(nèi)具備哪些條件
從目前的情況來看,國內(nèi)在發(fā)展這類大模型上可以說已經(jīng)具備一定的條件。比如在算法層面,國內(nèi)的互聯(lián)網(wǎng)公司以及一些研究院,已經(jīng)具備研究語言大模型的基礎;在算力層面,國內(nèi)的AI大算力芯片,以及在算力集群方面,也已經(jīng)取得長足進步;在部署和服務方面,國內(nèi)的云服務廠商可以提供各種服務渠道,讓基礎設施能夠便捷實用,使算法在大算力平臺上很好的部署。
不足之處在于,第一,ChatGPT能夠達到現(xiàn)在的水平,是因為它六七年長時間的產(chǎn)品迭代,從GPT-1到GPT-2再到ChatGPT期間有大量的用戶使用,在數(shù)據(jù)集的標注、分揀、精煉上,也有很多創(chuàng)新的工程化步驟。對于中文大模型來說,差距在于如何獲得更多、更有意義,更有價值的語義語料,如何在算法迭代、大量的用戶使用之后,使能更大規(guī)模模型的推進。
第二,大模型的訓練離不開大算力,燧原科技創(chuàng)始人兼COO張亞林在接受電子發(fā)燒友采訪的時候表示,目前國際廠商的高算力芯片在中國仍然具有標桿效應。
第三,在生態(tài)建設上,無論是現(xiàn)在很火的ChatGPT,還是之前備受關注的生成式AI公司Stability、Runway,他們在基礎模型、大模型的模型開發(fā)庫,用戶大量的應用上,都已經(jīng)形成了可以觸達終端用戶的商業(yè)模式。而在國內(nèi),目前還沒樹立起這樣全棧的生態(tài)和商業(yè)模式。
不過,雖然國內(nèi)在發(fā)展這類大模型方面存在不足,整體而言這對于國內(nèi)廠商來是個很好的機會。從算力方面來看,人工智能技術的發(fā)展和應用本身對算力的需求極大,目前全球大模型訓練的算力基本以英偉達為主。
隨著ChatGPT的爆火,國內(nèi)各類生成式AI大模型的訓練和部署將會加速,這對國內(nèi)人工智能算力廠商來說無疑是個機會,國內(nèi)廠商需要思考如何通過自身的算力發(fā)展,來持續(xù)推動中國本土大模型的進步。
ChatGPT爆火,算力廠商如何把握機會
那么AIGC大模型的訓練和推理,對算力供應商有怎樣的要求呢?對此,張亞林談到了幾點:首先是芯片,包括芯片的有效算力、架構的創(chuàng)新性、以及芯片的性價比等,這些將會決定算力集群是否具備足夠的市場競爭力。
其次是集群系統(tǒng),一個超大規(guī)模的集群系統(tǒng),由幾千張加速卡、幾千顆芯片組成,還包括互聯(lián)和存儲。除了加速卡的性能之外,還要看整個系統(tǒng)的穩(wěn)定性、集群的互聯(lián)效率、存儲的效率、以及分布式系統(tǒng)運行的穩(wěn)定性。
第三是軟件生態(tài),它是否能夠支持整個大模型的調試和開發(fā)。這要求企業(yè)不僅要能提供基礎的軟件棧,還要能夠提供大模型能跑的分布式框架,讓調試者和開發(fā)者能夠更好的調試和開發(fā)這些大模型,就是說還需要具備一個整套的軟件棧。
張亞林認為,從芯片設計,集群的穩(wěn)定性,到整個軟件棧的完備性,這對于初創(chuàng)公司來說還有一段很長的路要走,需要持續(xù)的產(chǎn)品迭代。
那么國內(nèi)在AI大算力芯片或者GPGPU賽道的廠商,如何能夠抓住ChatGPT這波浪潮帶來的機會呢?首先,它需要做出高性價比的算力,現(xiàn)在來說這樣的算力還太貴,以致于并不是所有人都能夠玩得起這場游戲,企業(yè)需要能夠推出高性價比的集群,讓整個ChatGPT類大模型的開發(fā)更經(jīng)濟。
第二,最終呈現(xiàn)在用戶側的是整個的集群系統(tǒng),就如上文所言,其中包括幾千張加速卡,幾千顆芯片,大量的互聯(lián)和存儲,很多服務器。因此,國內(nèi)的AI大芯片廠商需要能夠站到系統(tǒng)的角度去看問題,包括整個系統(tǒng)的設計、調動能力、讓用戶易用,這些跟芯片本身的設計和開發(fā)能力會不太一樣。
第三,如何讓用戶在開發(fā)過程中做到高效和易用。訓練本身是一個很復雜、很廣闊的生態(tài)。今天的大模型,其實是把很廣闊的需求濃縮到了一些比較確定的大模型上,這讓整個訓練從很廣闊的發(fā)散狀態(tài),變成了有可能聚焦在某一些維度上就能夠很好的支撐和優(yōu)化的狀態(tài)。
這給國內(nèi)很多AI廠商提供了很好的思路,企業(yè)可以聚焦在比如大模型集群化的領域。國內(nèi)廠商可以由此切入,誰能夠在這樣一個大規(guī)模AI生成領域,把訓練和推理整套集群系統(tǒng),做得更優(yōu)化、更完整、更易用,誰就能夠在這場游戲中拔得先機。
在人工智能算力領域,燧原科技已經(jīng)有了很深的積累。目前燧原科技已經(jīng)迭代了兩代訓練和推理產(chǎn)品,第三代也已經(jīng)在研發(fā)中。此外,燧原科技已經(jīng)在科研領域和智慧城市的應用中落地了訓練和推理的超千卡算力集群。張亞林表示,類似ChatGPT這樣的AIGC生成式模型,對于燧原科技而言是個機遇,公司可以把已經(jīng)積累的系統(tǒng)集群的經(jīng)驗推廣到更多的客戶賽道上,幫助客戶使能更多大模型的生成。
同時,面對生成式AI大模型帶來的發(fā)展機會,燧原科技將從多個方面去做深度布局。第一是持續(xù)推進和迭代集群化產(chǎn)品和軟件生態(tài)棧,與更多戰(zhàn)略用戶一起優(yōu)化集群系統(tǒng),提高性價比和能效比;第二是與國內(nèi)云服務商進行深度合作,通過他們的云服務平臺,觸達更多To B和To C用戶;第三是與國家相關機構合作制定更多關于AIGC標準和白皮書,探討未來發(fā)展方向,與國家政策和標準融合;第四是與更多大模型廠商、云平臺廠商等一起共創(chuàng)生態(tài)。
小結
整體而言,雖然目前ChatGPT仍然還存在一些問題,不過它的強大功能卻是有目共睹。對于人們的生產(chǎn)生活來說,ChatGPT等大模型的發(fā)展將會帶來勞動力的釋放。
未來隨著模型的進一步擴大,數(shù)據(jù)集進一步加強,AIGC這類巨大模型將會愈發(fā)智能,它也將會更加逼近人們所說的通用人工智能(AGI),而這個過程必然給相關產(chǎn)業(yè)帶來機會,包括算力,而對于用戶來說,廠商如何提供更高能效比、性價比的算力是關鍵。
ChatGPT的爆火給生成式AI的應用帶來更多可能性,AI語言處理大模型也隨之進入全球角逐的新階段。在國內(nèi),百度、阿里等頭部互聯(lián)網(wǎng)企業(yè)都已經(jīng)宣布有相關的研究。那么,國內(nèi)在發(fā)展AI語言處理大模型方面是否具備相應的條件,國產(chǎn)廠商可以如何把握這個機會?
在AIGC大模型發(fā)展上,國內(nèi)具備哪些條件
從目前的情況來看,國內(nèi)在發(fā)展這類大模型上可以說已經(jīng)具備一定的條件。比如在算法層面,國內(nèi)的互聯(lián)網(wǎng)公司以及一些研究院,已經(jīng)具備研究語言大模型的基礎;在算力層面,國內(nèi)的AI大算力芯片,以及在算力集群方面,也已經(jīng)取得長足進步;在部署和服務方面,國內(nèi)的云服務廠商可以提供各種服務渠道,讓基礎設施能夠便捷實用,使算法在大算力平臺上很好的部署。
不足之處在于,第一,ChatGPT能夠達到現(xiàn)在的水平,是因為它六七年長時間的產(chǎn)品迭代,從GPT-1到GPT-2再到ChatGPT期間有大量的用戶使用,在數(shù)據(jù)集的標注、分揀、精煉上,也有很多創(chuàng)新的工程化步驟。對于中文大模型來說,差距在于如何獲得更多、更有意義,更有價值的語義語料,如何在算法迭代、大量的用戶使用之后,使能更大規(guī)模模型的推進。
第二,大模型的訓練離不開大算力,燧原科技創(chuàng)始人兼COO張亞林在接受電子發(fā)燒友采訪的時候表示,目前國際廠商的高算力芯片在中國仍然具有標桿效應。
第三,在生態(tài)建設上,無論是現(xiàn)在很火的ChatGPT,還是之前備受關注的生成式AI公司Stability、Runway,他們在基礎模型、大模型的模型開發(fā)庫,用戶大量的應用上,都已經(jīng)形成了可以觸達終端用戶的商業(yè)模式。而在國內(nèi),目前還沒樹立起這樣全棧的生態(tài)和商業(yè)模式。
不過,雖然國內(nèi)在發(fā)展這類大模型方面存在不足,整體而言這對于國內(nèi)廠商來是個很好的機會。從算力方面來看,人工智能技術的發(fā)展和應用本身對算力的需求極大,目前全球大模型訓練的算力基本以英偉達為主。
隨著ChatGPT的爆火,國內(nèi)各類生成式AI大模型的訓練和部署將會加速,這對國內(nèi)人工智能算力廠商來說無疑是個機會,國內(nèi)廠商需要思考如何通過自身的算力發(fā)展,來持續(xù)推動中國本土大模型的進步。
ChatGPT爆火,算力廠商如何把握機會
那么AIGC大模型的訓練和推理,對算力供應商有怎樣的要求呢?對此,張亞林談到了幾點:首先是芯片,包括芯片的有效算力、架構的創(chuàng)新性、以及芯片的性價比等,這些將會決定算力集群是否具備足夠的市場競爭力。
其次是集群系統(tǒng),一個超大規(guī)模的集群系統(tǒng),由幾千張加速卡、幾千顆芯片組成,還包括互聯(lián)和存儲。除了加速卡的性能之外,還要看整個系統(tǒng)的穩(wěn)定性、集群的互聯(lián)效率、存儲的效率、以及分布式系統(tǒng)運行的穩(wěn)定性。
第三是軟件生態(tài),它是否能夠支持整個大模型的調試和開發(fā)。這要求企業(yè)不僅要能提供基礎的軟件棧,還要能夠提供大模型能跑的分布式框架,讓調試者和開發(fā)者能夠更好的調試和開發(fā)這些大模型,就是說還需要具備一個整套的軟件棧。
張亞林認為,從芯片設計,集群的穩(wěn)定性,到整個軟件棧的完備性,這對于初創(chuàng)公司來說還有一段很長的路要走,需要持續(xù)的產(chǎn)品迭代。
那么國內(nèi)在AI大算力芯片或者GPGPU賽道的廠商,如何能夠抓住ChatGPT這波浪潮帶來的機會呢?首先,它需要做出高性價比的算力,現(xiàn)在來說這樣的算力還太貴,以致于并不是所有人都能夠玩得起這場游戲,企業(yè)需要能夠推出高性價比的集群,讓整個ChatGPT類大模型的開發(fā)更經(jīng)濟。
第二,最終呈現(xiàn)在用戶側的是整個的集群系統(tǒng),就如上文所言,其中包括幾千張加速卡,幾千顆芯片,大量的互聯(lián)和存儲,很多服務器。因此,國內(nèi)的AI大芯片廠商需要能夠站到系統(tǒng)的角度去看問題,包括整個系統(tǒng)的設計、調動能力、讓用戶易用,這些跟芯片本身的設計和開發(fā)能力會不太一樣。
第三,如何讓用戶在開發(fā)過程中做到高效和易用。訓練本身是一個很復雜、很廣闊的生態(tài)。今天的大模型,其實是把很廣闊的需求濃縮到了一些比較確定的大模型上,這讓整個訓練從很廣闊的發(fā)散狀態(tài),變成了有可能聚焦在某一些維度上就能夠很好的支撐和優(yōu)化的狀態(tài)。
這給國內(nèi)很多AI廠商提供了很好的思路,企業(yè)可以聚焦在比如大模型集群化的領域。國內(nèi)廠商可以由此切入,誰能夠在這樣一個大規(guī)模AI生成領域,把訓練和推理整套集群系統(tǒng),做得更優(yōu)化、更完整、更易用,誰就能夠在這場游戲中拔得先機。
在人工智能算力領域,燧原科技已經(jīng)有了很深的積累。目前燧原科技已經(jīng)迭代了兩代訓練和推理產(chǎn)品,第三代也已經(jīng)在研發(fā)中。此外,燧原科技已經(jīng)在科研領域和智慧城市的應用中落地了訓練和推理的超千卡算力集群。張亞林表示,類似ChatGPT這樣的AIGC生成式模型,對于燧原科技而言是個機遇,公司可以把已經(jīng)積累的系統(tǒng)集群的經(jīng)驗推廣到更多的客戶賽道上,幫助客戶使能更多大模型的生成。
同時,面對生成式AI大模型帶來的發(fā)展機會,燧原科技將從多個方面去做深度布局。第一是持續(xù)推進和迭代集群化產(chǎn)品和軟件生態(tài)棧,與更多戰(zhàn)略用戶一起優(yōu)化集群系統(tǒng),提高性價比和能效比;第二是與國內(nèi)云服務商進行深度合作,通過他們的云服務平臺,觸達更多To B和To C用戶;第三是與國家相關機構合作制定更多關于AIGC標準和白皮書,探討未來發(fā)展方向,與國家政策和標準融合;第四是與更多大模型廠商、云平臺廠商等一起共創(chuàng)生態(tài)。
小結
整體而言,雖然目前ChatGPT仍然還存在一些問題,不過它的強大功能卻是有目共睹。對于人們的生產(chǎn)生活來說,ChatGPT等大模型的發(fā)展將會帶來勞動力的釋放。
未來隨著模型的進一步擴大,數(shù)據(jù)集進一步加強,AIGC這類巨大模型將會愈發(fā)智能,它也將會更加逼近人們所說的通用人工智能(AGI),而這個過程必然給相關產(chǎn)業(yè)帶來機會,包括算力,而對于用戶來說,廠商如何提供更高能效比、性價比的算力是關鍵。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
算力
+關注
關注
2文章
1196瀏覽量
15645 -
ChatGPT
+關注
關注
29文章
1589瀏覽量
9088
發(fā)布評論請先 登錄
相關推薦
熱點推薦
大算力芯片的生態(tài)突圍與算力革命
電子發(fā)燒友網(wǎng)報道(文 / 李彎彎)大算力芯片,即具備強大計算能力的集成電路芯片,主要應用于高性能計算(HPC)、人工智能(AI)、數(shù)據(jù)中心、自動駕駛等需要海量數(shù)據(jù)并行計算的場景。隨著 AI 與大數(shù)
燧原科技助力美圖AI換裝全球爆火
2025蛇年元宵后,美圖公司旗下美顏相機憑借“AI換裝”功能爆火,獲得了國內(nèi)外用戶的極大青睞,App下載量和使用量迅速激增的同時,也面臨了海量推理算力即時支持的挑戰(zhàn)。
【一文看懂】什么是端側算力?
隨著物聯(lián)網(wǎng)(IoT)、人工智能和5G技術的快速發(fā)展,端側算力正逐漸成為智能設備性能提升和智能化應用實現(xiàn)的關鍵技術。什么是端側算力,它的應用價值是什么,與云計算、邊緣計算有哪些區(qū)別?本文


科技云報到:要算力更要“算利”,“精裝算力”觸發(fā)大模型產(chǎn)業(yè)新變局?
科技云報到:要算力更要“算利”,“精裝算力”觸發(fā)大模型產(chǎn)業(yè)新變局?
算力基礎篇:從零開始了解算力
算力即計算能力(Computing Power),狹義上指對數(shù)字問題的運算能力,而廣義上指對輸入信息處理后實現(xiàn)結果輸出的一種能力。雖然處理的內(nèi)容不同,但處理過程的能力都可抽象為算力。比

企業(yè)AI算力租賃是什么
企業(yè)AI算力租賃是指企業(yè)通過互聯(lián)網(wǎng)向專業(yè)的算力提供商租用所需的計算資源,以滿足其AI應用的需求。以下是對企業(yè)AI算
GPU算力開發(fā)平臺是什么
隨著AI技術的廣泛應用,算力需求呈現(xiàn)出爆發(fā)式增長。AI算力租賃作為一種新興的服務模式,正逐漸成為企業(yè)獲取算
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽
本帖最后由 1653149838.791300 于 2024-10-16 22:19 編輯
感謝平臺提供的書籍,厚厚的一本,很有分量,感謝作者的傾力付出成書。
本書主要講算力芯片CPU
發(fā)表于 10-15 22:08
淺析三大算力之異同
隨著一年多前ChatGPT的出現(xiàn)引爆人工智能(AI)浪潮,支撐大模型背后的“算力”概念突然闖進我們的視野,成為科技圈炙手可熱的新詞,引領著最新潮流。作為數(shù)字經(jīng)濟時代新生產(chǎn)力,也許不少人

國內(nèi)最大智算中心月底在哈爾濱投用
國內(nèi)算力領域迎來重大進展,中國移動智算中心(哈爾濱)節(jié)點即將于8月30日正式啟用,標志著國內(nèi)最大的智算
大模型時代的算力需求
現(xiàn)在AI已進入大模型時代,各企業(yè)都爭相部署大模型,但如何保證大模型的算力,以及相關的穩(wěn)定性和性能,是一個極為重要的問題,帶著這個極為重要的問題,我需要在此書中找到答案。
發(fā)表于 08-20 09:04
中科曙光入選2024算力服務產(chǎn)業(yè)圖譜及算力服務產(chǎn)品名錄
近日,中國信通院公布首個《算力服務產(chǎn)業(yè)圖譜(2024年)》及《算力服務產(chǎn)品名錄(2024年)》。曙光智算構建的全國一體化
評論