AI由人類發(fā)明,現(xiàn)在OpenAI卻用AI解讀AI,而且在未來幾年,這可能都是相關(guān)研究的風(fēng)向標(biāo)。
作者丨史林
【資料圖】
編輯丨董子博
在各個AI、科技公司紛紛投入大模型的今天,OpenAI已經(jīng)成了各家爭相比較的對象,每個大模型發(fā)布的時候都不可避免地要拿來和ChatGPT對比。
例如說,某頭部企業(yè)發(fā)布大模型時聲稱自己和ChatGPT的差距只有一兩個月,但也有友商認(rèn)為該企業(yè)可能是活在平行世界,差距應(yīng)該是三年;
OpenAI之所以難以追趕,是因為他們不止在技術(shù)上領(lǐng)先于其他競爭對手一個周期,就連目前在做的事情和理念也領(lǐng)先了競爭對手一個周期,比如說用AI解釋AI,用黑盒解釋黑盒。
就在剛剛過去的本周二,OpenAI又公布了一項重量級研究成果:用GPT-4解釋GPT-2的神經(jīng)元行為,引起全球吃瓜群眾嘖嘖稱奇的同時也不免讓人心生好奇,AI不是人類發(fā)明的嗎,為什么現(xiàn)在需要用AI來解讀AI?
OpenAI本周二在官網(wǎng)發(fā)布博客文章《 語言模型可以解釋語言模型中的神經(jīng)元 》(Language models can explain neurons in language models),就表示:
“我們使用GPT-4自動編寫大型語言模型中神經(jīng)元行為的解釋,并為這些解釋評分。我們發(fā)布了GPT-2中每個神經(jīng)元的這些(不完美的)解釋和分?jǐn)?shù)的數(shù)據(jù)集。”
一篇論文發(fā)布,本來不值得稱奇;但讀過這篇論文的人,卻大多不免被OpenAI的奇思異想震撼,頭皮發(fā)麻。
打從ChatGPT橫掃科技圈的那天,就一直有人發(fā)問:“到了今天這一步,AI是怎樣實現(xiàn)這么強大的功能的?”
為了回答這個問題,OpenAI的做法可以簡單的概括為“用黑盒解釋黑盒”。而且OpenAI的這次研究成果,倒也不失為后續(xù)AI與大模型等相關(guān)企業(yè)進行研究探索了新的方向,自然意義非凡。
此次對神經(jīng)元的解釋恰如當(dāng)年的科研工程“人類基因組計劃”,辨識基因及其序列對醫(yī)學(xué),生物學(xué),乃至整個生命科學(xué)都產(chǎn)生難以估量的深遠影響,實現(xiàn)了破譯人類遺傳信息的終極目的,而對每個神經(jīng)元的解釋也意味著人類在破解AI奧秘的漫漫長路上又前進了一步。
1
研究的起因
自去年11月ChatGPT上線以來,大語言模型(LLM)就引起了普遍關(guān)注,引起關(guān)于AI倫理與治理的擔(dān)憂也日益的水漲船高:“LLM等大模型的能力越來越強,部署和應(yīng)用的也越來越廣泛,但對其內(nèi)部工作方式的理解,我們?nèi)匀恢跎?。?
因為大模型自帶“黑盒”性質(zhì),外界很難分辨它們的輸出結(jié)果是否采用了帶有某種見不得人的方法,AI幻覺難以根治,“一本正經(jīng)的胡說八道”也常常導(dǎo)致令人啼笑皆非,哭笑不得的結(jié)果,因而了解黑盒內(nèi)部的工作方式,特別是黑盒的“可解釋性”是迫切需要解決的一個重要問題。
通常說來,AI的工作方式可以視為對人類大腦工作方式的逆運用與模仿。而黑盒也在結(jié)構(gòu)上模仿大腦,由海量的神經(jīng)元組成。比如ChatGPT就是在學(xué)習(xí)文本的同時觀察其中的規(guī)律,以及這些規(guī)律如何影響最終的結(jié)果。因此要想說明“可解釋性”就要先了解每個神經(jīng)元在做什么。
從AI的角度來說,每個神經(jīng)元都代表著不同的數(shù)據(jù)以及與之相關(guān)的特征,如果神經(jīng)元數(shù)量有限或許可以用人力完成,但是如今大模型的神經(jīng)網(wǎng)絡(luò)包含的參數(shù)動輒百億千億,而且還在不斷進化發(fā)展,再依靠人力明顯是癡人說夢。
那么OpenAI用GPT-4解釋GPT-2的神經(jīng)元行為也就不難理解了,對此官方表示“我們用GPT-4為GPT-2中的神經(jīng)元行為自動編寫解釋,并為這些解釋打分?!盙PT-2首發(fā)于2019年2月,神經(jīng)元約30萬個,參數(shù)量約15億。
2
實際表現(xiàn)與引起的反響
此次的解釋過程可分為三步:
1.給GPT-4一個GPT-2已有的神經(jīng)元,由GPT-4展示相關(guān)的文本序列和激活情況,產(chǎn)生一個對此類行為的解釋;
2.再次使用GPT-4,模擬被解釋的神經(jīng)元會做什么;
3.比較二者的結(jié)果,根據(jù)匹配程度對GPT-4的解釋進行評分。
雖然OpenAI官方表示GPT-4解釋了GPT-2中的約30萬個神經(jīng)元,但是絕大多數(shù)的實際得分都偏低。只有勉強一千多個的得分高于0.8,這意味著神經(jīng)元的大部分頂級激活行為都是這一千多個神經(jīng)元引起的。看來AI或許也在有意無意間遵循“二八定律”。
此外OpenAI官方還表示,他們這次采取的方法局限性很大,未來需要逐步攻克,比如:
1.整個過程中對算力的消耗大的驚人;
2.GPT-4給出的解釋普遍簡短,但神經(jīng)元都有著非常復(fù)雜的行為,不可能用簡單的語言就描述清楚;
3.GPT-4只解釋了神經(jīng)元的行為,而沒有解釋驅(qū)動行為背后的機制,而機制部分顯然更有意義;
4.這種方法的確解釋了神經(jīng)元的行為,但沒有涉及下游影響,希望最終能實現(xiàn)流程的自動化,并解釋能實現(xiàn)復(fù)雜行為的整個神經(jīng)回路。
對于OpenAI公布的研究成果,很快在全球各大技術(shù)平臺也引起了廣泛關(guān)注。有人批評其得分甚低:“對GPT-2的解釋尚且如此,那如何了解GPT-3和GPT-4內(nèi)部結(jié)構(gòu)呢?但這才是許多人現(xiàn)在更關(guān)注的答案?!?
也有人感慨AI進化的方式愈發(fā)先進:“未來就是用AI完善AI模型,會加速進化?!边€有人擔(dān)心AI進化的未來:“再搞下去,AI真的要覺醒了?”
3
啟發(fā)
人的大腦,其實就是神經(jīng)元組成的網(wǎng)絡(luò)。從計算機的角度上來講,它的結(jié)構(gòu)十分低效——它沒有存儲設(shè)備,神經(jīng)元的通訊也是通過化學(xué)的方式來進行,相當(dāng)?shù)膭e扭。
用這種“落后”的“元器件”,竟然能給人類如此高的智慧,說明人腦的強大,強在架構(gòu)。
如前所述,AI可以視為對大腦運轉(zhuǎn)的模仿,而探索生命模型也是腦科學(xué)研究的中心任務(wù)之一,是探索人類自身、解密思維與智能成因的科學(xué)探索需要。
腦科學(xué)與AI息息相關(guān),既可以提升我們?nèi)祟悓ψ陨韸W秘的理解,也可以改善對腦部疾病的認(rèn)知水平,同時相關(guān)科研成果也可以為發(fā)展類腦計算,突破傳統(tǒng)電腦架構(gòu)的束縛提供依據(jù)。
而相信“類腦計算”才是AI未來的,OpenAI并不是獨一家。
北京大學(xué)信息科學(xué)技術(shù)學(xué)院教授,計算機科學(xué)技術(shù)系系主任,北京智源研究院院長——黃鐵軍教授,就致力于模擬出類似人類的神經(jīng)網(wǎng)絡(luò)系統(tǒng),并培養(yǎng)出AI的可進化能力。
利用類腦計算技術(shù),黃鐵軍和他的“天演”團隊創(chuàng)造了一個高精度模擬的秀麗線蟲,其中302個相互連接的神經(jīng)元、嗅覺和運動神經(jīng)環(huán)路都被還原,展現(xiàn)出了生物神經(jīng)元計算的巨大潛力。
但在當(dāng)下,類腦計算還具有著巨大的空間,等待著科研力量填補——當(dāng)下千億量級參數(shù)的大模型,如果把參數(shù)看成神經(jīng)的突觸,大模型對應(yīng)人腦的神經(jīng)元,只有1億個。
而1億個神經(jīng)元,這與人腦千億級別的神經(jīng)元,中間還差了1000倍的差距,而這或許也是走向AGI,人類科學(xué)必須跨越的鴻溝。
而OpenAI新近發(fā)表的這篇論文,也在無形中,給了人類科學(xué)技術(shù)的進步,展示了一種可能性:
當(dāng)未來人工智能變得越發(fā)強大,甚至有一天超越人類,它也能在后續(xù)更多的前沿科技上,為人類提供幫助;而對智能的研究, 在生物大腦之外,也有了AI系統(tǒng)作為新的研究對象,這也為破解智能之謎帶來了新的希望。
版權(quán)聲明
轉(zhuǎn)自AI科技評論,版權(quán)屬于原作者,僅用于學(xué)術(shù)分享
聲明
免責(zé)聲明:部分文章和信息來源于互聯(lián)網(wǎng),不代表本訂閱號贊同其觀點和對其真實性負(fù)責(zé)。如轉(zhuǎn)載內(nèi)容涉及版權(quán)等問題,請立即與小編聯(lián)系,我們將迅速采取適當(dāng)?shù)拇胧1居嗛喬栐瓌?chuàng)內(nèi)容,轉(zhuǎn)載需授權(quán),并注明作者和出處。 如需投稿請與小助理聯(lián)系
標(biāo)簽:
相關(guān)新聞
保險時訊
10-21
10-21
10-21
10-21
10-21
10-21
10-21
10-21
10-21
10-21
聚焦百姓
更多>