商湯科技發(fā)布5.0多模態(tài)大模型,綜合能力全面對標(biāo)GPT-4 Turbo
4月23日,商湯科技董事長兼CEO徐立在2024商湯技術(shù)交流日上發(fā)布了行業(yè)首個云、端、邊全棧大模型產(chǎn)品矩陣,能夠滿足不同規(guī)模場景應(yīng)用需求;升級“日日新SenseNova 5.0”大模型體系,綜合能力全面對標(biāo)GPT-4 Turbo。
此外對于文生視頻徐立也表示商湯科技很快就會發(fā)布相關(guān)的平臺產(chǎn)品。
備受矚目的商湯科技“日日新SenseNova” 5.0多模態(tài)大模型獨特地采用了混合專家(MoE)架構(gòu),能夠無縫支持多達(dá)10T Tokens的中英文訓(xùn)練數(shù)據(jù),并在此基礎(chǔ)上,推理合成數(shù)據(jù)更是可高達(dá)數(shù)千億Token。尤為值得一提的是,該模型在進(jìn)行推理計算時,其上下文窗口可以擴(kuò)展至約200K Token范圍,使得其綜合能力中的知識、推理、數(shù)學(xué)、代碼等方面均能全面對標(biāo)GPT-4Turbo。
商湯科技的領(lǐng)導(dǎo)團(tuán)隊表示,這是業(yè)界首個真正意義上的“云、端、邊”全棧大模型產(chǎn)品矩陣,旨在滿足各種規(guī)模場景的應(yīng)用需求。他們堅信,公司的技術(shù)領(lǐng)先地位將進(jìn)一步加速生成式AI向產(chǎn)業(yè)落地的全面躍遷,從而實現(xiàn)大模型的按需所取。
商湯科技的董事長兼首席執(zhí)行官徐立先生表示,在遵循尺度定律(Scaling Law)的原則下,商湯科技始終致力于推動自身大模型的研發(fā)工作,并將持續(xù)探索大模型能力的KRE三層架構(gòu)(知識-推理-執(zhí)行),不斷突破大模型能力的邊界。他充滿信心地指出,“我們深信,2024年將會是端側(cè)大模型爆發(fā)的重要年份。”
據(jù)了解,自去年4月首次亮相以來,商湯科技的“日日新SenseNova”大模型體系已經(jīng)成功推出了五個重大版本迭代。而此次的更新重點則集中在提升了知識、數(shù)學(xué)、推理以及代碼能力等多個方面,全面對標(biāo)GPT-4 Turbo,并在主流客觀評測中達(dá)到甚至超過了GPT-4 Turbo的水平。
-
商湯科技
+關(guān)注
關(guān)注
8文章
563瀏覽量
36795 -
大模型
+關(guān)注
關(guān)注
2文章
3141瀏覽量
4064
發(fā)布評論請先 登錄
商湯日日新SenseNova融合模態(tài)大模型 國內(nèi)首家獲得最高評級的大模型
商湯“日日新”融合大模型登頂大語言與多模態(tài)雙榜單
如何在邊緣端獲得GPT4-V的能力:算力魔方+MiniCPM-V 2.6

商湯科技推出“日日新”融合大模型
商湯日日新多模態(tài)大模型權(quán)威評測第一
商湯星云發(fā)布新一代智能服務(wù)器AIS 4.0
訊飛星火大模型技術(shù)進(jìn)展及落地
訊飛星火大模型4.0 Turbo正式發(fā)布
Llama 3 與 GPT-4 比較
科大訊飛發(fā)布訊飛星火4.0 Turbo:七大能力超GPT-4 Turbo
訊飛星火內(nèi)容運營大師新增三大功能
云知聲山海多模態(tài)大模型UniGPT-mMed登頂MMMU測評榜首

商湯Sensechat向香港用戶免費開放
云知聲推出山海多模態(tài)大模型
商湯絕影在行業(yè)率先實現(xiàn)原生多模態(tài)大模型的車端部署

評論