99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPT-5正秘密訓(xùn)練!DeepMind聯(lián)創(chuàng)爆料,這模型比GPT-4大100倍

CVer ? 來源:新智元 ? 2023-09-04 16:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【導(dǎo)讀】GPT-5仍在秘密訓(xùn)練中!DeepMind聯(lián)合創(chuàng)始人在近日采訪中透露,未來3年,Inflection模型要比現(xiàn)在的GPT-4大1000倍。

近來,DeepMind聯(lián)合創(chuàng)始人Mustafa Suleyman,現(xiàn)Inflection AI的CEO,在采訪時投出了重磅炸彈:

OpenAI正在秘密訓(xùn)練GPT-5。

我認(rèn)為我們都直截了當(dāng)?shù)卣f會更好。這就是為什么我們披露了擁有的計算總量。

在未來18個月內(nèi),Inflection AI訓(xùn)練的模型比當(dāng)前的前沿模型大100倍。未來3年內(nèi),Inflection的模型比現(xiàn)在大1000倍。

6ad308f2-4ae1-11ee-97a6-92fbcf53809c.png

其實,Sam Altman此前曾否認(rèn)訓(xùn)練GPT-5的這一說法。

對此,網(wǎng)友表示,OpenAI可能給它起了一個新名字,所以他們才說沒有訓(xùn)練GPT-5。

6b001cfc-4ae1-11ee-97a6-92fbcf53809c.png

這就像當(dāng)時Code Interpreter推出一樣,許多人感覺其能力早已不是GPT-4模型,而應(yīng)該是GPT-4.5。

另外,采訪中,Suleyman還爆出了很多自己在DeepMind和Inflection AI工作時的內(nèi)部信息,包括了谷歌當(dāng)時收購DeepMind和之后的抓馬,某種程度上解釋了為什么DeepMind相比于OpenAI「起了個大早,卻趕了個晚集」。

他還認(rèn)為,開源模型可能會增加AI帶給人類的不穩(wěn)定和危害。

而AI安全性最大的威脅來源并不是大語言模型,而是未來可能出現(xiàn)的自主智能體。

訪談全文

當(dāng)被問到未來AI是否有可能會成為一個有自主進(jìn)化能力的智能體時,Suleyman認(rèn)為:

在短期之內(nèi),不太可能出現(xiàn)這種智能體——能夠自主運行,能夠制定自己的目標(biāo),能夠識別環(huán)境中的新信息、新的獎勵信號,并學(xué)會用它作為自我監(jiān)督,并且隨著時間的推移更新自己權(quán)重的人工智能體。

但是這種自主進(jìn)化能力的AI是所有人都不應(yīng)該忽視的東西,因為如果某種AI技術(shù)真的展現(xiàn)出這種能力的,它可能會有非常大的潛在風(fēng)險。

至少他知道的范圍之內(nèi),Inflection AI和DeepMind都沒有在往這個方向上走。

Inflection AI不是一家AGI公司,他們想做的事就是希望能夠做出一個非常好用的個人助理。這個助理在能夠充分訪問用戶個人信息的前提下,為用戶提供高度定制化的AI服務(wù)。

模型訓(xùn)練軍備競賽會加劇AI的風(fēng)險嗎?

他的公司,Inflection AI正在建造世界上最大的超級計算機之一,并且他認(rèn)為在接下來的18個月內(nèi),他們可能會進(jìn)行一次比制造GPT-4的語言模型訓(xùn)練運行大10倍或100倍的訓(xùn)練運行。

當(dāng)被問到,這種軍備競賽式的訓(xùn)練模型可能會增加AI的風(fēng)險嗎,他回答到:

100倍的訓(xùn)練仍然會產(chǎn)生一個聊天機器人,可以理解為一個更好的GPT-4,盡管這會成為一個更令人印象深刻的模型,但這并不危險——因為它缺乏自主性,不能改造物理世界等讓模型自身變得危險的基本要素。

僅僅生產(chǎn)一個非常好的、更好的 GPT-4 還不算危險;為了讓它變得危險,我們需要增加其他能力,比如前邊提到的,讓模型能夠自我迭代,自我制定目標(biāo)等等。

那大約是五年、十年、十五年、二十年之后的事了。

Suleyman認(rèn)為,Sam Altman最近說過他們沒有訓(xùn)練 GPT-5,可能沒有說實話。(Come on. I don’t know. I think it’s better that we’re all just straight about it.)

他希望所有擁有大規(guī)模算力的公司都能盡可能的保持透明,這也是他們披露自己擁有的計算總量的原因。

他們正在訓(xùn)練比GPT-4更大的模型。目前,他們有6000臺H100正在訓(xùn)練模型。

到12月,22,000個H100全面投入運營。從現(xiàn)在開始,每個月都會增加1000到2000臺H100。

他認(rèn)為谷歌DeepMind也應(yīng)該做同樣的事情,應(yīng)該披露Gemini接受了多少FLOPS訓(xùn)練。

AI訓(xùn)練成本將如何變化

從算力成本的角度來看,未來AI訓(xùn)練的規(guī)模不可能達(dá)到訓(xùn)練某個模型需要100億美元的成本,除非真的有人會花3年時間去訓(xùn)練一個模型,因為堆疊越多算力去訓(xùn)練一個越大的模型,需要的時間也會更長。

雖然花的成本越高,可能能帶來更強的能力,但是這不是一個沒有上限的數(shù)學(xué)問題,需要考慮很多實際情況的限制。

但是因為算力成本隨著芯片算力的迭代在不斷下降,所以未來可能會出現(xiàn)訓(xùn)練某個模型的成本相當(dāng)于在2022年花費了100億美元來訓(xùn)練。

但是因為芯片算力會以2-3倍的效率增長,所以到時候訓(xùn)練一個這樣規(guī)模的成本會遠(yuǎn)遠(yuǎn)小于現(xiàn)在看起來的成本。

比如說,現(xiàn)在開源社區(qū)中的Llama2或者Falcon等模型,只有15億參數(shù)或20億參數(shù),就獲得了有1750億參數(shù)的GPT-3的參數(shù)的能力。

開源的看法

作為一直在閉源科技公司工作的Suleyman,對于開源模型的價值和可能的風(fēng)險,有非常與眾不同的觀點。

首先,他認(rèn)為,在未來5年這個時間維度之內(nèi),開源模型始終會落后最前沿的閉源模型3-5年的時間

而且,開源模型會增加AI帶來的社會風(fēng)險。

如果所有人都能無限制地訪問最新的模型,將會出現(xiàn)一個現(xiàn)象——「力量的快速擴(kuò)散」。

舉個栗子,就像新媒體平臺讓每個人都可以作為一份完整的報紙發(fā)揮作用,擁有數(shù)百萬粉絲,甚至能影響全世界。

對于最前沿模型的無限制訪問將會擴(kuò)大這種力量,因為在未來3年內(nèi),人類能夠訓(xùn)練出比現(xiàn)有模型規(guī)模大上1000倍的模型。

即便是Inflection AI,也能在未來18個月內(nèi)獲得比現(xiàn)在最前沿的模型大100倍的計算能力。

而開源的大模型會將這種力量交到每個人的手中,相當(dāng)于給了每個人一個潛在的大規(guī)模不穩(wěn)定破壞性的工具。

而到時候,再想辦法避免這些工具可能產(chǎn)生的破壞性后果,有人做了一個很巧妙的比喻——圖試圖通過用手接住雨水來讓雨停下來。

他曾經(jīng)向監(jiān)管部門解釋過,AI技術(shù)未來會降低很多潛在危險化合物或者武器的開發(fā)門檻。

AI能在實際制作這些東西時提供大量的幫助——比如告知在實驗室中遇到技術(shù)挑戰(zhàn)時從哪里獲取工具等等。不過確實,從預(yù)訓(xùn)練中刪除這些內(nèi)容,對模型進(jìn)行對齊等等辦法,可以有效地降低這樣的風(fēng)險。

總之,對于用大模型能力來做壞事的人,需要盡量讓他們在做這些事的時候變得困難。

但是如果盡可能的開源一切模型,未來面對能力越來越強的模型,將會把更多的類似風(fēng)險暴露出來。

所以雖然開源模型對于很多人來說確實是一件好事,能夠讓所有人都獲得模型并且進(jìn)行各種各樣的嘗試,帶來技術(shù)上的創(chuàng)新和改進(jìn),但是也一定要看到開源的風(fēng)險,因為并不是每個人都是善意和友好的。

雖然我說這樣的話可能會被很多人理解為我做的事和開源社區(qū)存在利益沖突,因此很多人可能會很生氣,但是我還是要表達(dá)我的觀點。

他還強調(diào)了,他不是為了攻擊開源社區(qū)才說出這番言論的:

「雖然我說這樣的話可能會被很多人理解為我做的事和開源社區(qū)存在利益沖突,因此很多人可能會很生氣,但是我還是要表達(dá)我的觀點,也希望獲得人們的支持?!?/p>

在谷歌和DeepMind期間的抓馬

在DeepMind度過的10年里,他花了大量時間試圖將更多的外部監(jiān)督融入到構(gòu)建AI技術(shù)的過程中。

這是一個相當(dāng)痛苦的過程。雖然他認(rèn)為谷歌的出發(fā)點是好地,但它運作的方式仍然像傳統(tǒng)的官僚機構(gòu)一樣。

當(dāng)我們設(shè)立了谷歌的倫理委員會時,計劃有九名獨立成員,是對于開發(fā)敏感技術(shù)過程中進(jìn)行外部監(jiān)督的重要措施。

但因為任命了一個保守派人士,而她過去曾發(fā)表過一些有爭議的言論,很多網(wǎng)友就在推特等場合抵制她,同時也抵制其他支持她的幾個成員,要求他們退出委員會。

這是一場徹底的悲劇,非常令人沮喪。我們花了兩年時間來建立這個委員會,這是朝著對我們正在開發(fā)的非常敏感的技術(shù)進(jìn)行外部審查的第一步。

不幸的是,在一周內(nèi),九名成員中的三名辭職了,最終她也辭職了,然后我們失去了半數(shù)委員會成員。

然后公司轉(zhuǎn)身說:「我們?yōu)槭裁匆腥藖硐拗谱约海窟@純粹是浪費時間。」

其實,當(dāng)DeepMind被收購時,我們提出了收購的條件,即我們要有一個倫理和安全委員會。

我們計劃在倫理和安全委員會之后,我們要將DeepMind打造成一個全球利益公司:一個所有利益相關(guān)者在做決策時都能發(fā)聲的公司。

它是一個按擔(dān)保有限責(zé)任公司設(shè)立的公司。然后,我們計劃制定一個憲章,為AGI的開發(fā)制定相關(guān)的倫理安全的目標(biāo);這樣使得我們可以將收入的大部分用于科學(xué)和社會使命。

這是一個非常有創(chuàng)意和實驗性的結(jié)構(gòu)。但是當(dāng)Alphabet看到設(shè)立倫理委員會發(fā)生的事情時,他們變得膽怯了。他們說:「這完全瘋了。你們的全球利益公司也會發(fā)生同樣的事情。為什么要那樣做?」

最終,我們將DeepMind合并進(jìn)入到了谷歌,從某種程度上說,DeepMind從未獨立過——現(xiàn)在當(dāng)然也完全從屬于谷歌。

谷歌下一代大模型Gemini

The Information獨家報道稱,谷歌多模態(tài)人工智能模型Gemini即將面世,直接對標(biāo)OpenAI的GPT-4。

6cbd55dc-4ae1-11ee-97a6-92fbcf53809c.png

其實,在今年谷歌I/O大會上,劈柴已經(jīng)向大眾宣布,谷歌正在研發(fā)下一代模型Gemini。

有傳言說,該模型將至少有1萬億參數(shù),訓(xùn)練將使用數(shù)以萬計的谷歌TPU AI芯片。

與OpenAI類似,谷歌使用GPT-4的方法來構(gòu)建模型,由多個具有特定能力的人工智能專家模型組成。

簡言之,Gemini同樣是一個混合專家模型(MoE)。

這也可能意味著,谷歌希望提供不同參數(shù)規(guī)模的Gemini,因為從成本效益上考慮是個不錯的選擇。

除了生成圖像和文本外,Gemini接受過YouTube視頻轉(zhuǎn)錄數(shù)據(jù)的訓(xùn)練,也可以生成簡單的視頻,類似于RunwayML Gen-2。

另外,比起B(yǎng)ard,Gemini在編碼能力方面也得到了顯著提升。

Gemini推出之后,谷歌也計劃逐步將其整合到自家產(chǎn)品線中,包括升級Bard,谷歌辦公全家桶、谷歌云等等。

其實,在Gemini之前,DeepMind還有一個代號為「Goodall」的模型,基于未宣布的模型Chipmunk打造,可與ChatGPT匹敵。

不過GPT-4誕生后,谷歌最后決放棄這一模型研發(fā)。

據(jù)稱,至少有20多位高管參與了Gemini的研發(fā),DeepMind的創(chuàng)始人Demis Hassabis領(lǐng)導(dǎo),谷歌創(chuàng)始人Sergey Brin參與研發(fā)。

還有谷歌DeepMind組成的數(shù)百名員工,其中包括前谷歌大腦主管Jeff Dean等等。

Demis Hassabis在此前接受采訪表示,Gemini將結(jié)合AlphaGo類型系統(tǒng)的一些優(yōu)勢和大型模型驚人的語言能力。

可以看到,谷歌已經(jīng)在全力備戰(zhàn),就等著Gemini開啟逆襲之路。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    561

    瀏覽量

    10802
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    368

    瀏覽量

    16118
  • DeepMind
    +關(guān)注

    關(guān)注

    0

    文章

    131

    瀏覽量

    11597

原文標(biāo)題:GPT-5正秘密訓(xùn)練!DeepMind聯(lián)創(chuàng)爆料,這模型比GPT-4大100倍

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    GPT-5即將面市 性能遠(yuǎn)超GPT-4

    行業(yè)芯事
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2025年06月04日 13:38:23

    用PaddleNLP在4060單卡上實踐大模型預(yù)訓(xùn)練技術(shù)

    手把手教您如何在單張消費級顯卡上,利用PaddleNLP實踐OpenAI的GPT-2模型的預(yù)訓(xùn)練。GPT-2的預(yù)訓(xùn)練關(guān)鍵技術(shù)與流程與
    的頭像 發(fā)表于 02-19 16:10 ?1019次閱讀
    用PaddleNLP在4060單卡上實踐大<b class='flag-5'>模型</b>預(yù)<b class='flag-5'>訓(xùn)練</b>技術(shù)

    OpenAI簡化大模型選擇:薩姆·奧特曼制定路線圖

    OpenAI的首席執(zhí)行官薩姆·奧特曼(Sam Altman)近期為公司的GPT-4.5和GPT-5模型開發(fā)制定了一項重要的路線圖,旨在極大地簡化和優(yōu)化用戶及開發(fā)人員在選擇AI模型時的
    的頭像 發(fā)表于 02-18 09:12 ?503次閱讀

    OpenAI即將發(fā)布GPT-4.5與GPT-5

    ,GPT-4.5將在未來幾周內(nèi)率先亮相,它將是OpenAI通用GPT-4模型的繼承者。這款新的算法在技術(shù)上進(jìn)行了諸多優(yōu)化和升級,旨在為用戶提供更加精準(zhǔn)、高效的AI服務(wù)。 而在GPT-4
    的頭像 發(fā)表于 02-13 13:43 ?653次閱讀

    今日看點丨OpenAI將發(fā)布新的GPT-4.5模型;三星西安工廠將升級286層NAND閃存工藝

    ,OpenAI將在未來幾個月內(nèi)推出名為GPT-5模型,該模型將整合OpenAI的大量技術(shù),包括o3,并應(yīng)用于聊天機器人C
    發(fā)表于 02-13 11:22 ?551次閱讀

    OpenAI即將推出GPT-5模型

    先進(jìn)技術(shù),其中包括備受矚目的o3工具。通過整合這些技術(shù),GPT-5模型將實現(xiàn)更加強大的功能和性能。 值得一提的是,GPT-5模型將被廣泛應(yīng)用于OpenAI的聊天機器人ChatGPT以及
    的頭像 發(fā)表于 02-13 11:21 ?598次閱讀

    OpenAI CEO預(yù)告GPT-4.5及GPT-5未來規(guī)劃

    全新的GPT-5模型。這一模型將整合包括o3在內(nèi)的多項OpenAI先進(jìn)技術(shù),旨在為用戶帶來更加智能、高效的使用體驗。值得注意的是,免費版的ChatGPT也將在標(biāo)準(zhǔn)智能設(shè)置下無限制地使用GPT-
    的頭像 發(fā)表于 02-13 10:02 ?450次閱讀

    OpenAI報告GPT-4o及4o-mini模型性能下降,正緊急調(diào)查

    近日,全球領(lǐng)先的AI研究機構(gòu)OpenAI發(fā)布了一份事故報告,引起了業(yè)界的廣泛關(guān)注。報告中指出,OpenAI目前正面臨GPT-4o和4o-mini兩款重要模型性能下降的問題。 據(jù)Ope
    的頭像 發(fā)表于 01-23 10:22 ?846次閱讀

    OpenAI:GPT-4o及4o-mini模型性能下降,展開調(diào)查

    近期,OpenAI發(fā)布了一份事故報告,指出其GPT-4o及4o-mini模型遭遇了性能下降的問題。這一消息引起了業(yè)界的廣泛關(guān)注和討論。 據(jù)OpenAI官方透露,他們目前正在積極調(diào)查這一性能下降的原因
    的頭像 發(fā)表于 01-21 10:34 ?668次閱讀

    GPT-5研發(fā)進(jìn)度滯后,成果與成本不匹配

    近日,OpenAI正在緊鑼密鼓地研發(fā)的下一代大型語言模型GPT-5,其研發(fā)進(jìn)度已落后于原計劃。這一消息引起了業(yè)界的廣泛關(guān)注。 報道指出,盡管OpenAI在GPT-5的研發(fā)上投入了大量的人力、物力
    的頭像 發(fā)表于 12-23 14:16 ?511次閱讀

    OpenAI GPT-5開發(fā)滯后:訓(xùn)練成本高昂

    近日,據(jù)最新消息,OpenAI在推進(jìn)其備受期待的下一代旗艦模型GPT-5的開發(fā)進(jìn)程上遇到了困難。由于計算成本高昂且高質(zhì)量訓(xùn)練數(shù)據(jù)稀缺,GPT-5的開發(fā)已經(jīng)落后于原定計劃半年之久。 據(jù)悉
    的頭像 發(fā)表于 12-23 11:04 ?749次閱讀

    OpenAI推遲GPT-5發(fā)布,專注草莓計劃GPT-o1及AI代理愿景

    形成了有力競爭。然而,近日OpenAI的首席執(zhí)行官Sam Altman卻透露了一個出人意料的消息:盡管公司計劃在年底前推出多項重要更新,但備受期待的GPT-5并不會在今年面世。
    的頭像 發(fā)表于 11-05 16:57 ?886次閱讀

    解鎖 GPT-4o!2024 ChatGPT Plus 代升級全攻略(附國內(nèi)支付方法)

    ChatGPT Plus 每月 20 美元,OpenAI 承諾 Plus 用戶享有更快的響應(yīng)速度、優(yōu)先使用新功能及最新模型,包括強大的 GPT-4o。本文將分享 2024 年 ChatGPT
    的頭像 發(fā)表于 10-29 18:17 ?2520次閱讀

    Llama 3 與 GPT-4 比較

    隨著人工智能技術(shù)的飛速發(fā)展,我們見證了一代又一代的AI模型不斷突破界限,為各行各業(yè)帶來革命性的變化。在這場技術(shù)競賽中,Llama 3和GPT-4作為兩個備受矚目的模型,它們代表了當(dāng)前AI領(lǐng)域的最前
    的頭像 發(fā)表于 10-27 14:17 ?1169次閱讀

    科大訊飛發(fā)布訊飛星火4.0 Turbo:七大能力超GPT-4 Turbo

    超過GPT-4 Turbo,數(shù)學(xué)能力和代碼能力更是超過了Open AI最新一代GPT模型GPT-4o。此外,其效率相對提升50%。
    的頭像 發(fā)表于 10-24 11:39 ?1091次閱讀