99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

LLM之外的性價比之選,小語言模型

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚 ? 2024-06-03 05:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群



電子發(fā)燒友網(wǎng)報道(文/周凱揚)大語言模型的風靡給AI應(yīng)用創(chuàng)造了不少機會,無論是效率還是創(chuàng)意上,大語言模型都帶來了前所未有的表現(xiàn),這些大語言模型很快成為大型互聯(lián)網(wǎng)公司或者AI應(yīng)用公司的殺手級產(chǎn)品。然而在一些對實時性要求較高的應(yīng)用中,比如AI客服、實時數(shù)據(jù)分析等,大語言模型并沒有太大的優(yōu)勢。

在動輒萬億參數(shù)的LLM下,硬件需求已經(jīng)遭受了不小的挑戰(zhàn)。所以面對一些相對簡單的任務(wù),規(guī)模較小的小語言模型(SLM)反而更加適合。尤其是在端側(cè)的本地AI模型,在低功耗算力有限的邊緣AI芯片支持下,小語言模型反而更適合發(fā)揮最高性能,而不是促使硬件一味地去追求更大規(guī)模模型的支持。

微軟Phi

2023年,微軟推出了一個基于Transformer架構(gòu)的小語言模型Phi-1,該模型只有13億參數(shù),且主要專注于基礎(chǔ)的Python編程,實現(xiàn)文本轉(zhuǎn)代碼。整個模型僅僅用到8塊A100 GPU,耗時四天訓練完成的。

這也充分說明了小語言模型的靈活性,在LLM普遍需要成百上千塊GPU,花費數(shù)十乃至上百天的時間完成模型的訓練時,SLM卻只需要千分之一的資源,就可以針對特定的任務(wù)打造適合的模型。

近日,微軟對Phi模型進行了全面更新,推出了Phi-3-mini、Phi-3-small和Phi-3-medium三個版本。其中Phi3-mini是一個38億參數(shù)的小語言模型,同步推出的Phi-3-small和Phi-3-medium分別為70億參數(shù)和140億參數(shù)的模型。

Phi-3-mini有支持4K和128K兩個上下文長度的版本,也是這個規(guī)模的模型中,第一個支持到最高128K上下文長度的版本,微軟聲稱其性能甚至超過不少70億參數(shù)的大模型。通過在搭載A16芯片的iPhone 14上測試,在純粹的設(shè)備端離線運行下,Phi-3-mini可以做到12 token每秒的速度。

谷歌Gemma


在Gemini模型獲得成功后,基于大語言模型框架Gemini,谷歌也開發(fā)了對應(yīng)的輕量小語言模型Gemma。Gemma分為20億參數(shù)和70億參數(shù)的版本,其中20億參數(shù)的Gemma可以在移動設(shè)備和筆記本電腦上運行,而70億參數(shù)的版本則可以擴展至小型服務(wù)器上。雖然資源占用不高,但Gemma在各項基準測試中,依然可以與更大規(guī)模的模型相媲美,比如130億參數(shù)的Llama-2等。

此外,谷歌不僅提供了預(yù)訓練版本的Gemma,也支持通過額外的訓練來實現(xiàn)模型調(diào)優(yōu),用于修改Gemma模型的行為,提高其在特定任務(wù)上的表現(xiàn),比如通過人類語言互動進行訓練,提高聊天機器人中響應(yīng)式對話輸入的表現(xiàn)等。

?
Gemma與Llama-2的性能對比/谷歌


在對運行設(shè)備的要求上,Gemma自然比不上大哥Gemini,但谷歌與英偉達合作,針對從數(shù)據(jù)中心到云端再到RTX AI PC的GPU都進行了優(yōu)化,這樣一來不僅具有廣泛的跨設(shè)備兼容性,也能確保擴展性和高性能的雙重優(yōu)勢。

寫在最后


小語言模型的出現(xiàn)為行業(yè)帶來了新的選擇,尤其是在大多數(shù)大模型應(yīng)用還是在不斷燒錢的當下,小語言模型加速落地的同時,也提供了訓練成本更低的解決方案。但與此同時,小語言模型的缺陷依然不可忽視,比如其規(guī)模注定了無法存儲足夠的“事實性知識”,其次這類小語言模型很難做到多語言支持。但我們必須認清小語言模型的存在并不是為了替代大語言模型,而是提供一個更加靈活的模型方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3517

    瀏覽量

    50382
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3134

    瀏覽量

    4053
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    325

    瀏覽量

    832
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    小白學大模型:從零實現(xiàn) LLM語言模型

    在當今人工智能領(lǐng)域,大型語言模型LLM)的開發(fā)已經(jīng)成為一個熱門話題。這些模型通過學習大量的文本數(shù)據(jù),能夠生成自然語言文本,完成各種復雜的任
    的頭像 發(fā)表于 04-30 18:34 ?482次閱讀
    小白學大<b class='flag-5'>模型</b>:從零實現(xiàn) <b class='flag-5'>LLM</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b>

    詳解 LLM 推理模型的現(xiàn)狀

    2025年,如何提升大型語言模型LLM)的推理能力成了最熱門的話題之一,大量優(yōu)化推理能力的新策略開始出現(xiàn),包括擴展推理時間計算、運用強化學習、開展監(jiān)督微調(diào)和進行提煉等。本文將深入探討LLM
    的頭像 發(fā)表于 04-03 12:09 ?476次閱讀
    詳解 <b class='flag-5'>LLM</b> 推理<b class='flag-5'>模型</b>的現(xiàn)狀

    新品 | Module LLM Kit,離線大語言模型推理模塊套裝

    推理與數(shù)據(jù)交互需求。ModuleLLM是一款集成化的離線大語言模型(LLM)推理模塊,專為需要高效、智能交互的終端設(shè)備設(shè)計。Module13.2LLMMate模塊
    的頭像 發(fā)表于 03-28 18:49 ?355次閱讀
    新品 | Module <b class='flag-5'>LLM</b> Kit,離線大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>推理模塊套裝

    無法在OVMS上運行來自Meta的大型語言模型LLM),為什么?

    無法在 OVMS 上運行來自 Meta 的大型語言模型LLM),例如 LLaMa2。 從 OVMS GitHub* 存儲庫運行 llama_chat Python* Demo 時遇到錯誤。
    發(fā)表于 03-05 08:07

    新品| LLM630 Compute Kit,AI 大語言模型推理開發(fā)平臺

    LLM630LLM推理,視覺識別,可開發(fā),靈活擴展···LLM630ComputeKit是一款A(yù)I大語言模型推理開發(fā)平臺,專為邊緣計算和智能交互應(yīng)用而設(shè)計。該套件的主板搭載愛芯AX63
    的頭像 發(fā)表于 01-17 18:48 ?688次閱讀
    新品| <b class='flag-5'>LLM</b>630 Compute Kit,AI 大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>推理開發(fā)平臺

    小白學大模型:構(gòu)建LLM的關(guān)鍵步驟

    隨著大規(guī)模語言模型LLM)在性能、成本和應(yīng)用前景上的快速發(fā)展,越來越多的團隊開始探索如何自主訓練LLM模型。然而,是否從零開始訓練一個
    的頭像 發(fā)表于 01-09 12:12 ?952次閱讀
    小白學大<b class='flag-5'>模型</b>:構(gòu)建<b class='flag-5'>LLM</b>的關(guān)鍵步驟

    什么是LLM?LLM在自然語言處理中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,自然語言處理(NLP)領(lǐng)域迎來了革命性的進步。其中,大型語言模型LLM)的出現(xiàn),標志著我們對語言理解能力的一次
    的頭像 發(fā)表于 11-19 15:32 ?3633次閱讀

    如何訓練自己的LLM模型

    訓練自己的大型語言模型LLM)是一個復雜且資源密集的過程,涉及到大量的數(shù)據(jù)、計算資源和專業(yè)知識。以下是訓練LLM模型的一般步驟,以及一些關(guān)
    的頭像 發(fā)表于 11-08 09:30 ?1493次閱讀

    LLM技術(shù)對人工智能發(fā)展的影響

    隨著人工智能技術(shù)的飛速發(fā)展,大型語言模型LLM)技術(shù)已經(jīng)成為推動AI領(lǐng)域進步的關(guān)鍵力量。LLM技術(shù)通過深度學習和自然語言處理技術(shù),使得機器
    的頭像 發(fā)表于 11-08 09:28 ?1844次閱讀

    使用LLM進行自然語言處理的優(yōu)缺點

    自然語言處理(NLP)是人工智能和語言學領(lǐng)域的一個分支,它致力于使計算機能夠理解、解釋和生成人類語言。大型語言模型
    的頭像 發(fā)表于 11-08 09:27 ?2434次閱讀

    LLM和傳統(tǒng)機器學習的區(qū)別

    在人工智能領(lǐng)域,LLM(Large Language Models,大型語言模型)和傳統(tǒng)機器學習是兩種不同的技術(shù)路徑,它們在處理數(shù)據(jù)、模型結(jié)構(gòu)、應(yīng)用場景等方面有著顯著的差異。 1.
    的頭像 發(fā)表于 11-08 09:25 ?1865次閱讀

    新品|LLM Module,離線大語言模型模塊

    LLM,全稱大語言模型(LargeLanguageModel)。是一種基于深度學習的人工智能模型。它通過大量文本數(shù)據(jù)進行訓練,從而能夠進行對話、回答問題、撰寫文本等其他任務(wù)
    的頭像 發(fā)表于 11-02 08:08 ?1035次閱讀
    新品|<b class='flag-5'>LLM</b> Module,離線大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>模塊

    理解LLM中的模型量化

    在本文中,我們將探討一種廣泛采用的技術(shù),用于減小大型語言模型LLM)的大小和計算需求,以便將這些模型部署到邊緣設(shè)備上。這項技術(shù)稱為模型量化
    的頭像 發(fā)表于 10-25 11:26 ?683次閱讀
    理解<b class='flag-5'>LLM</b>中的<b class='flag-5'>模型</b>量化

    LLM模型推理加速的關(guān)鍵技術(shù)

    LLM(大型語言模型)大模型推理加速是當前人工智能領(lǐng)域的一個研究熱點,旨在提高模型在處理復雜任務(wù)時的效率和響應(yīng)速度。以下是對
    的頭像 發(fā)表于 07-24 11:38 ?1796次閱讀

    富士通與Cohere合作,專注于開發(fā)和提供大型語言模型(LLM)

    富士通(Fujitsu)與總部位于多倫多與舊金山的頂尖安全及數(shù)據(jù)隱私人工智能企業(yè)Cohere Inc.攜手宣布建立深度戰(zhàn)略合作伙伴關(guān)系,共同致力于大型語言模型LLM)的創(chuàng)新與開發(fā),旨在為企業(yè)界帶來前所未有的日語處理能力,進而優(yōu)
    的頭像 發(fā)表于 07-16 16:55 ?846次閱讀