每日經(jīng)濟(jì)新聞 2024-03-12 21:51:40
◎ 阿爾特曼、黃仁勛在不同場(chǎng)合表示,AGI或在五年內(nèi)實(shí)現(xiàn)。
每經(jīng)記者 李孟林 每經(jīng)編輯 蘭素英
“五年內(nèi),AGI很可能就會(huì)到來(lái)。”這不是科幻小說(shuō)的情節(jié),而是業(yè)界大佬的預(yù)言。
近日,隨著Anthropic最新一代大模型Claude 3被曝表現(xiàn)出“自我意識(shí)”,以及馬斯克正式起訴OpenAI及其首席執(zhí)行官山姆•阿爾特曼,AGI(通用人工智能)再次成為AI屆熱議的話題。在對(duì)OpenAI的起訴書(shū)中,馬斯克稱OpenAI的GPT-4系統(tǒng)已經(jīng)實(shí)現(xiàn)了AGI,不過(guò)OpenAI直接予以了否認(rèn)。
這一系列事件讓外界產(chǎn)生了一種錯(cuò)覺(jué):AGI似乎真的不遠(yuǎn)了。阿爾特曼和英偉達(dá)CEO黃仁勛也相繼表示,AGI可能在5年內(nèi)實(shí)現(xiàn)。
然而,在沸沸揚(yáng)揚(yáng)的議論中,何謂AGI仍然是一個(gè)莫衷一是的概念。作為DeepMind的首席AGI科學(xué)家,Shane Legg曾是首批將這一概念引入計(jì)算機(jī)科學(xué)界的人之一。近期,他與同事聯(lián)合發(fā)表了一篇論文,從六個(gè)方面定義了AGI,并劃分了六個(gè)等級(jí),為公眾厘清AGI提供了參考。
由OpenAI前員工創(chuàng)建、獲亞馬遜大力支持的初創(chuàng)企業(yè)Anthropic最近推出了最新一代的大模型Claude 3.0,在許多關(guān)鍵指標(biāo)與OpenAI最新的GPT-4打平甚至超越后者。
更有趣的是,該公司的員工Alex Albert在X平臺(tái)(原推特)上表示,該系列模型的最強(qiáng)版本Claude 3 Opus在測(cè)試過(guò)程中,識(shí)別到人類在對(duì)其進(jìn)行測(cè)試,展現(xiàn)出“自我意識(shí)”的跡象。
具體而言,測(cè)試人員在一大堆話題中插入了一個(gè)完全不相關(guān)的披薩配料問(wèn)題,Claude 3 Opus表示:“我懷疑這個(gè)披薩配料‘事實(shí)’插入進(jìn)來(lái)是一個(gè)玩笑,或者測(cè)試我是否在集中注意力,因?yàn)樗渌麊?wèn)題完全不相匹配。”不少AI研究人員表示,這個(gè)模型展現(xiàn)出了“對(duì)思考進(jìn)行思考”的元認(rèn)知能力,自我意識(shí)進(jìn)入到了一個(gè)新水平,似乎是朝向更高級(jí)的AGI邁了一步。
在此之前,OpenAI推出了“王炸級(jí)”文本生視頻模型Sora,并將其定義為可以生成視頻的世界模型(World Simulators),并認(rèn)為這是打造通用世界模型的潛在方法之一。圖靈獎(jiǎng)得主、Meta的首席AI科學(xué)家楊力昆(Yann LeCun)一直認(rèn)為,要實(shí)現(xiàn)AI的智能突破,需要一個(gè)能理解周遭世界的世界模型,才能最終通往AGI,而這也正是當(dāng)前的大語(yǔ)言模型所缺乏的。
除開(kāi)技術(shù)方面的進(jìn)步,近期馬斯克對(duì)OpenAI的起訴也將焦點(diǎn)之一對(duì)準(zhǔn)了AGI。馬斯克在起訴書(shū)中表示,GPT-4已經(jīng)可以被當(dāng)作早期的AGI,但是其內(nèi)部細(xì)節(jié)只有OpenAI和微軟才知道。這一說(shuō)法是基于微軟自己的評(píng)估。2023年3月,微軟研究員在一份預(yù)印本論文中表示,GPT-4在很多能力上與人類持平或更強(qiáng),已經(jīng)有了AGI的“火花”。
所有這些讓外界對(duì)AGI有了更強(qiáng)的期待,難道AGI真的離走進(jìn)現(xiàn)實(shí)不遠(yuǎn)了?對(duì)此,部分業(yè)界大佬似乎有著樂(lè)觀的預(yù)期。
OpenAI CEO阿爾特曼在電子書(shū)《我們的AI旅途》中的采訪中提到,AGI可能在五年內(nèi)實(shí)現(xiàn)。“5年左右,也許會(huì)稍長(zhǎng)一些。沒(méi)有人能說(shuō)出一個(gè)確切的時(shí)間,也沒(méi)有人知道它對(duì)社會(huì)的影響到底是什么。”阿爾特曼表示。“當(dāng)AI能夠獨(dú)立完成創(chuàng)新的科學(xué)突破時(shí),它就能被稱為AGI了。”
與阿爾特曼不謀而合的還有英偉達(dá)的CEO黃仁勛。他在近期的一個(gè)論壇上表示,如果把AGI標(biāo)準(zhǔn)定為通過(guò)人類創(chuàng)制的各種測(cè)試的話,那么不出5年,AI就可以通過(guò)任何人類測(cè)試。當(dāng)前的AI可以通過(guò)律師考試,但對(duì)胃腸病學(xué)等專業(yè)醫(yī)療測(cè)試仍然表現(xiàn)不佳。
但在樂(lè)觀的氛圍之外,也有人在潑冷水。紐約大學(xué)教授Gary Marcus就表示,依靠不斷提高大模型的數(shù)據(jù)量并非解決AI現(xiàn)存問(wèn)題的方法,芯片領(lǐng)域的摩爾定律不一定會(huì)在AI領(lǐng)域復(fù)現(xiàn),大模型并非通往AGI的答案,AI需要的是范式轉(zhuǎn)換。楊力昆同樣認(rèn)為,要實(shí)現(xiàn)人類水平的AI,當(dāng)前的大語(yǔ)言模型是走了岔路,因?yàn)槠鋵?shí)質(zhì)是預(yù)測(cè)下一個(gè)單詞,而無(wú)法謀劃和推理。
1965年,AI研究先驅(qū)Herbert Simon曾樂(lè)觀地預(yù)測(cè),20年之內(nèi)機(jī)器就可以完成人類的任何工作。很顯然,現(xiàn)實(shí)離Simon的預(yù)測(cè)相差甚遠(yuǎn)。
AGI到底是什么?
正如許多前沿科學(xué)的關(guān)鍵概念一樣,AGI的標(biāo)準(zhǔn)可謂眾說(shuō)紛紜,且其內(nèi)涵一直在隨著研究的進(jìn)展不斷變化。但有一點(diǎn)可以肯定的是,正如其名字“通用人工智能”所示,AGI一定是相對(duì)只能完成某種特定任務(wù)如下圍棋或者翻譯的“狹義”AI而言的。
在AGI概念之前,學(xué)術(shù)界對(duì)達(dá)到人類水平或以上的討論集中在哲學(xué)界,如著名的“圖靈測(cè)試”或哲學(xué)家約翰•賽爾提出的“強(qiáng)人工智能”等概念。1997年,北卡羅萊納大學(xué)的物理學(xué)家Mark Gubrud首次提出了AGI這個(gè)概念。在他的定義中,AGI指的是在復(fù)雜程度和速度上可以和人腦媲美的AI系統(tǒng),可以獲取一般性知識(shí),并以其為基礎(chǔ)進(jìn)行操作和推理,可以在任何工業(yè)或軍事活動(dòng)中發(fā)揮人類智力的作用。
OpenAI在其組織章程中,將AGI定義為“可以在大多數(shù)經(jīng)濟(jì)上有價(jià)值的工作中超越人類的高級(jí)自動(dòng)系統(tǒng)”。谷歌研究院副總裁Blaise Agüera y Arcas則認(rèn)為,AGI的關(guān)鍵指標(biāo)在于“通用性”,既然當(dāng)前的大模型已經(jīng)能夠討論大多數(shù)問(wèn)題,處理多種模態(tài)的信息輸入輸出,這就是已經(jīng)是AGI了。
“如果你邀請(qǐng)100個(gè)AI專家來(lái)定義AGI,你可能會(huì)得到100個(gè)相互關(guān)聯(lián)但又不同的定義。”2023年11月,知名AI公司DeepMind聯(lián)合創(chuàng)始人、首席AGI科學(xué)家的Shane Legg及公司研究人員在一篇論文中表示。2002年,Legg便開(kāi)始在計(jì)算機(jī)界普及AGI概念,按照他當(dāng)時(shí)的定義,AGI是指在認(rèn)知任務(wù)上能取得類人表現(xiàn)的機(jī)器智能。
而在最新的這篇論文中,Legg及其同事試圖建立一個(gè)評(píng)估AGI的概念框架,是當(dāng)前AI界對(duì)于AGI問(wèn)題最深入的探討之一。他們梳理了現(xiàn)在的AGI定義,并從中提取了6個(gè)AGI應(yīng)該滿足的原則,然后以類似自動(dòng)駕駛分級(jí)的方式,給AGI的性能劃分了五個(gè)階段。
然而,這篇論文并沒(méi)有給出AGI的定義,只是給出了定義AGI的六項(xiàng)原則。具體而言:
1、注重能力,而非過(guò)程:即只考慮AI系統(tǒng)完成任務(wù)的能力,而不考慮系統(tǒng)的推理過(guò)程是否像人腦一樣思考,也不討論系統(tǒng)是有“意識(shí)”和“感知能力”。
2、注重通用性與性能:既要考慮AI系統(tǒng)的通用性(寬度),也要考慮其性能水平(深度)。Blaise Agüera y Arcas的標(biāo)準(zhǔn)就過(guò)度關(guān)注通用性,而忽視了性能標(biāo)準(zhǔn)。
3、注重認(rèn)知與元認(rèn)知任務(wù):即聚焦在非實(shí)體的“認(rèn)知”活動(dòng)上,暫不考慮AI系統(tǒng)“具身化”到機(jī)器人系統(tǒng),從而在現(xiàn)實(shí)世界操作的能力。
4、專注于潛力而不是實(shí)際應(yīng)用:即AI系統(tǒng)需要具備某種能力的潛能即可,不需要在現(xiàn)實(shí)世界中達(dá)到此種效果,因?yàn)楹笳呱婕吧鐣?huì)、法律、倫理等多種因素制約。
5、重視實(shí)際適用性:指評(píng)價(jià)AGI的標(biāo)準(zhǔn)應(yīng)該是完成現(xiàn)實(shí)世界中人類覺(jué)得有價(jià)值的任務(wù)。
6、關(guān)注實(shí)現(xiàn)AGI的路徑,而非單一終點(diǎn):即將AGI的能力分為多個(gè)層級(jí),而非單個(gè)的門(mén)檻標(biāo)準(zhǔn),從而能容納多種AGI的定義方式。
按照最后一個(gè)原則,該論文也將AGI分為了L0到L5六個(gè)等級(jí),分別為:無(wú)AI,初現(xiàn),合格,專家,大師和超人類。論文認(rèn)為,2023年推出的ChatGPT、谷歌Bard、Meta的Llama 2,即當(dāng)前主要的大模型,還處在L1階段,也就是和未經(jīng)訓(xùn)練的普通人差不多或稍好一點(diǎn)。后四個(gè)等級(jí)的AGI都還沒(méi)有出現(xiàn)。接下來(lái)的L2到L5級(jí)別,分別對(duì)應(yīng)超越50%、90%、99%和100%的有技巧成年人。
封面圖片來(lái)源:新華社記者 金立旺 攝
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP