99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Zyphra推出Zamba2-mini 1.2B模型

CHANBAEK ? 來源:網(wǎng)絡整理 ? 作者:網(wǎng)絡整理 ? 2024-08-29 18:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,AI創(chuàng)新先鋒Zyphra公司在科技界投下了一顆震撼彈,正式揭曉其最新力作——Zamba2-mini 1.2B模型。這款被譽為端側(cè)SOTA(State-Of-The-Art)級別的小語言模型,以其卓越的性能參數(shù)和極致的壓縮效率,成為了業(yè)界關(guān)注的焦點。

Zamba2-mini 1.2B攜帶著驚人的12億參數(shù)量,卻能在嚴苛的4bit量化條件下,將內(nèi)存占用控制在驚人的700MB以下,這一成就無疑是對AI模型輕量化探索的一次重大突破。其背后,是Zyphra團隊對模型架構(gòu)的深度優(yōu)化與大膽創(chuàng)新,成功融合了多種神經(jīng)網(wǎng)絡設計的精髓,既保留了大型密集變壓器模型的高質(zhì)量輸出特性,又實現(xiàn)了小模型難以企及的計算與內(nèi)存效率。

Zamba2-mini 1.2B的問世,不僅為端側(cè)設備提供了更為強大的智能支持,更預示著AI技術(shù)在實際應用場景中的廣泛落地與深度融合。隨著這一技術(shù)的不斷成熟與普及,我們有理由相信,未來的端側(cè)AI將更加智能、高效,為人們的生活帶來更多便利與驚喜。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 變壓器
    +關(guān)注

    關(guān)注

    162

    文章

    7791

    瀏覽量

    139486
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35167

    瀏覽量

    280103
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3521

    瀏覽量

    50441
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    在MAC mini4上安裝Ollama、Chatbox及模型交互指南

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 一,簡介 本文將指導您如何在MAC mini4上安裝Ollama和Chatbox,并下載Deepseek-r1:32b模型。Ollama是一個用于管理和運行
    的頭像 發(fā)表于 03-11 17:17 ?828次閱讀
    在MAC <b class='flag-5'>mini</b>4上安裝Ollama、Chatbox及<b class='flag-5'>模型</b>交互指南

    壁仞科技推出阿里QWQ-32B模型一體機

    能力等關(guān)鍵測試中展現(xiàn)出卓越性能。 作為國產(chǎn)AI算力重要推動力量,壁仞科技不斷測試與更新適配最先進大模型,聯(lián)合生態(tài)合作伙伴共同推出QWQ-32B模型一體機。 在
    的頭像 發(fā)表于 03-10 09:05 ?1227次閱讀
    壁仞科技<b class='flag-5'>推出</b>阿里QWQ-32<b class='flag-5'>B</b>大<b class='flag-5'>模型</b>一體機

    摩爾線程支持阿里云通義千問QwQ-32B開源模型

    近日,阿里云團隊正式開源全新推理模型——通義千問QwQ-32B。摩爾線程在該模型發(fā)布后2小時內(nèi),迅速且高效完成了對千問QwQ-32B的支持。
    的頭像 發(fā)表于 03-07 17:48 ?724次閱讀
    摩爾線程支持阿里云通義千問QwQ-32<b class='flag-5'>B</b>開源<b class='flag-5'>模型</b>

    OpenAI o3-mini模型思維鏈遭質(zhì)疑

    近日,OpenAI公開了其大模型o3-mini的推理思維鏈,這一舉措使得免費用戶和付費用戶都能深入了解模型的思考過程。這一透明度的提升,原本旨在增強用戶對模型的信任和理解,然而卻意外引
    的頭像 發(fā)表于 02-08 10:57 ?645次閱讀

    OpenAI或?qū)?b class='flag-5'>推出o3 mini推理AI模型

    近日,據(jù)最新消息,OpenAI即將在幾周內(nèi)推出一款全新的推理AI模型——o3 mini。這一消息由OpenAI的首席執(zhí)行官Sam Altman在1月17日通過社交媒體平臺X發(fā)布的一篇文章中透露
    的頭像 發(fā)表于 01-21 10:06 ?647次閱讀

    OpenAI即將推出o3 mini推理AI模型

    計劃在接下來的幾周內(nèi)正式推出這一創(chuàng)新成果。 這一消息無疑為人工智能領(lǐng)域注入了新的活力。作為OpenAI的最新力作,o3 mini推理AI模型在技術(shù)上實現(xiàn)了諸多突破,旨在為用戶提供更加高效、精準的推理服務。通過采用先進的算法和
    的頭像 發(fā)表于 01-20 10:54 ?568次閱讀

    OpenAI即將推出o3-mini,降低高級推理門檻

    OpenAI在人工智能領(lǐng)域的探索與創(chuàng)新從未停歇,為開發(fā)者們帶來了一個又一個驚喜。近日,OpenAI開發(fā)者體驗負責人傳來好消息,表示公司即將向廣大開發(fā)者推出全新的o3-mini模型。 這一消息的發(fā)布
    的頭像 發(fā)表于 01-18 11:23 ?840次閱讀

    圖森未來發(fā)布“Ruyi”視頻大模型,Ruyi-Mini-7B版本現(xiàn)已開源

    重大獻禮。 尤為值得一提的是,圖森未來已經(jīng)將Ruyi的Mini-7B版本正式開源,用戶現(xiàn)在可以通過huggingface平臺輕松下載并使用這一強大的工具。這一舉措無疑將極大地推動視頻大模型在更廣泛領(lǐng)域的應用和發(fā)展。 “Ruyi”模型
    的頭像 發(fā)表于 12-20 15:19 ?1423次閱讀

    Meta推出Llama 3.3 70B,AI大模型競爭白熱化

    在今年的AI領(lǐng)域,Meta也不甘落后,推出了其壓軸之作——Llama 3.3 70B模型。與此同時,馬斯克的xAI也宣布其Grok模型從今天起全球免費開放(但存在一定的使用限制)。
    的頭像 發(fā)表于 12-09 14:50 ?806次閱讀

    智譜推出四個全新端側(cè)模型 攜英特爾按下AI普及加速鍵

    ,GLM-Edge-4B-chat、GLM-Edge-1.5B-chat為端側(cè)大語言模型,GLM-Edge-V-5B、GLM-Edge-V-2B
    的頭像 發(fā)表于 12-02 17:13 ?601次閱讀
    智譜<b class='flag-5'>推出</b>四個全新端側(cè)<b class='flag-5'>模型</b> 攜英特爾按下AI普及加速鍵

    阿里國際推出全球首個B2B AI搜索引擎Accio

    近日,在歐洲科技峰會Web Summit上,阿里國際正式推出了全球首個B2B領(lǐng)域的AI搜索引擎——Accio。這一創(chuàng)新產(chǎn)品面向全球商家開放,標志著阿里國際正式入局當前備受矚目的AI Search賽道。
    的頭像 發(fā)表于 11-15 16:53 ?1213次閱讀

    PerfXCloud重磅升級 阿里開源最強視覺語言模型Qwen2-VL-7B強勢上線!

    體驗吧! Qwen2-VL Qwen2-VL模型由阿里推出,在描述圖像、理解視頻以及解答視覺相關(guān)問題等方面表現(xiàn)極為卓越。該模型提供
    的頭像 發(fā)表于 10-23 11:07 ?776次閱讀
    PerfXCloud重磅升級  阿里開源最強視覺語言<b class='flag-5'>模型</b>Qwen<b class='flag-5'>2-VL-7B</b>強勢上線!

    英偉達發(fā)布AI模型 Llama-3.1-Nemotron-51B AI模型

    英偉達公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,這個AI大模型是源自 Meta 公司的 Llama-3.1-70B
    的頭像 發(fā)表于 09-26 17:30 ?930次閱讀

    馬斯克旗下xAI對Grok-2-mini進行速度升級

    科技巨頭馬斯克旗下的xAI公司近日宣布了一項重大進展,其熱門語言模型Grok-2-mini成功完成了速度升級。
    的頭像 發(fā)表于 08-27 15:28 ?635次閱讀

    OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜

    OpenAI推出了GPT-4o mini模型,用來取代GPT-3.5.這是目前市場上最具成本效益的小模型。 ? 該模型在MMLU上得分為82
    的頭像 發(fā)表于 07-21 10:20 ?1692次閱讀
    OpenAI <b class='flag-5'>推出</b> GPT-4o <b class='flag-5'>mini</b> 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜