AI巔峰之作:還會(huì)犯錯(cuò)的GPT4對(duì)誰(shuí)有用?
2023-03-17 12:16:47    騰訊網(wǎng)

3月15日凌晨1點(diǎn),OpenAI正式推出GPT4文本生成AI系統(tǒng) 。相比GPT3.5,GPT4的用戶(hù)體驗(yàn)大大改進(jìn),其功能性和準(zhǔn)確度均有不小提高,更被openAI視為里程碑。但是,不足之處仍然存在,GPT4的邏輯推理能力依然有不小的提高空間。

我們依然要冷靜,一半天才一半白癡的AI雨人,不會(huì)取代底層打工人的崗位,更不能高估GPT4的消費(fèi)性應(yīng)用價(jià)值。


(資料圖片)

GPT4真正的優(yōu)勢(shì)體現(xiàn)是在全球大國(guó)AI 軍備競(jìng)賽中,GPT4具備分析全球互聯(lián)網(wǎng)大數(shù)據(jù)情報(bào)的超能力,有人會(huì)為此積極買(mǎi)單。

1.GPT4比chatGPT高在哪里?

一是功能高。根據(jù)官方介紹,GPT-4是一個(gè)多模態(tài)大型語(yǔ)言模型,即支持圖像和文本輸入,以文本形式輸出;擴(kuò)寫(xiě)能力增強(qiáng),能處理超過(guò)25000個(gè)單詞的文本;更具創(chuàng)造力,并且能夠處理更細(xì)微的指令。

大型語(yǔ)言模型已經(jīng)由chatGPT科普過(guò)了,如何理解這里的黑話(huà)“多模態(tài)”?文字輸入文字表達(dá)即為單模態(tài),現(xiàn)在的 GPT-4可以接收?qǐng)D片輸入,使用文字輸出的表達(dá),以后還會(huì)有視頻輸入文字輸出,這被稱(chēng)為多模態(tài)。

多模態(tài)比純文字就是高,與此前的GPT系列模型相比,這是GPT-4最大的突破之一。

不過(guò)該功能還沒(méi)有全面開(kāi)通。OpenAI創(chuàng)始人Sam Altman當(dāng)晚在社交媒體介紹稱(chēng),他們正在預(yù)覽GPT-4的圖片輸入模式,以防止可能出現(xiàn)的安全倫理問(wèn)題。

二是準(zhǔn)確度高。

OpenAI表示,新模型產(chǎn)生的錯(cuò)誤答案更少,將更少地偏離談話(huà)軌道,更少地談?wù)摻稍?huà)題,甚至在許多標(biāo)準(zhǔn)化測(cè)試中比人類(lèi)表現(xiàn)得更好。

OpenAI稱(chēng),該公司花費(fèi)6個(gè)月的時(shí)間,利用對(duì)抗性測(cè)試程序和ChatGPT的經(jīng)驗(yàn)教訓(xùn)迭代調(diào)整GPT-4,從而在真實(shí)性、可操縱性和拒絕超出設(shè)定范圍方面取得了有史以來(lái)最好的結(jié)果。

官方羅列了一些證據(jù)認(rèn)為,GPT4高級(jí)推理能力超過(guò)chatGPT。

例如,它在模擬律師考試中的得分能夠名列頭部10%左右,相比之下,GPT-3.5的得分只能排在尾部10%左右。

OpenAI稱(chēng),在公司內(nèi)部的對(duì)抗性真實(shí)性評(píng)估中,GPT-4的得分比最新的GPT-3.5高40%,相應(yīng)的“不允許內(nèi)容請(qǐng)求的傾向”降低了 82%,根據(jù)政策響應(yīng)敏感請(qǐng)求(如醫(yī)療建議和自我傷害)的頻率提高了29%。

不僅是英語(yǔ),該模型在多種語(yǔ)言方面均表現(xiàn)出優(yōu)越性。OpenAI稱(chēng),在測(cè)試的26種語(yǔ)言中,GPT-4在24種語(yǔ)言方面的表現(xiàn)均優(yōu)于GPT-3.5等其他大語(yǔ)言模型的英語(yǔ)語(yǔ)言性能。其中GPT-4的中文能夠達(dá)到80.1%的準(zhǔn)確性,而GPT-3.5的英文準(zhǔn)確性?xún)H為70.1%,GPT-4英文準(zhǔn)確性提高到了85.5%。

“這是OpenAI努力擴(kuò)展深度學(xué)習(xí)的最新里程碑?!監(jiān)penAI介紹。

2.不過(guò),AI仍然不可靠。

盡管 GPT4進(jìn)步不小,但與早期的GPT模型一樣,GPT4仍然存在許多不足。

我覺(jué)著吧,經(jīng)過(guò)測(cè)試可以發(fā)現(xiàn),GPT4在知識(shí)的廣度、專(zhuān)業(yè)和學(xué)術(shù)表達(dá)方面的確表現(xiàn)較好,做到了“一本正經(jīng)”;但是智商方面,近似于人類(lèi)小學(xué)生,還是常常會(huì)“說(shuō)胡話(huà)”,尤其是數(shù)理運(yùn)算公式方面,還沒(méi)上幼兒園。

這是個(gè)明顯的弱點(diǎn)。

一半天才一半白癡,這算是人類(lèi)制造的機(jī)器“雨人”。

OpenAI也認(rèn)識(shí)到了這一點(diǎn) ?!癎PT-4缺乏對(duì)絕大多數(shù)數(shù)據(jù)切斷后(2021年9月)發(fā)生的事件的了解,并且無(wú)法從中吸取經(jīng)驗(yàn)教訓(xùn)……它有時(shí)會(huì)出現(xiàn)簡(jiǎn)單的推理錯(cuò)誤,它會(huì)輕信用戶(hù)明顯的虛假陳述,有時(shí)它會(huì)像人類(lèi)一樣在難題上失敗,例如在它生成的代碼中引入安全漏洞。”

基于此,OpenAI提醒,用戶(hù)在使用語(yǔ)言模型時(shí)應(yīng)格外小心,最好輔助以人工審查、附加上下文、或完全避免在高風(fēng)險(xiǎn)情況下使用它。

3.這種AI工具對(duì)誰(shuí)有用?

從AI智障到AI雨人,算是整個(gè)行業(yè)的進(jìn)步。為此,openAI正在積極推進(jìn)。openAI正在大舉招兵買(mǎi)馬,手里有微軟送過(guò)來(lái)的100億美元新軍費(fèi),未來(lái)十幾年不愁資金問(wèn)題,現(xiàn)在駕馭著微軟提供的全球第二算力的微軟云,正向全球頂級(jí)AI大牛發(fā)出橄欖枝。

“隨著我們繼續(xù)專(zhuān)注于可靠的擴(kuò)展,我們的目標(biāo)是完善我們的方法,以幫助我們?cè)絹?lái)越多地提前預(yù)測(cè)和準(zhǔn)備未來(lái)的能力——我們認(rèn)為這對(duì)安全至關(guān)重要?!?/p>

同時(shí),為了保持核心競(jìng)爭(zhēng)能力,openAI已經(jīng)對(duì)GPT模型完全封鎖。在目前OpenAI公開(kāi)的技術(shù)報(bào)告或公關(guān)文稿中,不包含任何關(guān)于模型架構(gòu)、硬件、算力等方面的更多信息,也不包括期待已久的 AI 視頻功能,也并沒(méi)有GPT4的任何核心技術(shù)論文信息。沒(méi)有人能拿到GPT3.5內(nèi)部細(xì)節(jié),更別奢望現(xiàn)在的GPT4了。

OpenAI對(duì)用戶(hù)開(kāi)放API接口,你可以調(diào)用它,設(shè)計(jì)自己簡(jiǎn)陋的APP。但是,你卻要源源不斷的輸送數(shù)據(jù),幫它完善模型,提升模型準(zhǔn)確度,甚至還要為此主動(dòng)付費(fèi)。這真是一門(mén)好生意。

鑒于GPT與中文世界一貫的保持了無(wú)形的距離,這個(gè)距離暫時(shí)無(wú)法打破;鑒于某些山寨品與GPT4.0差距實(shí)在太大,速成品就更沒(méi)法比了,因此,關(guān)于市場(chǎng)應(yīng)用和投資前景,依然不能著急。因此,你不能天真的以為,生成式AI可能快速改變各行各業(yè),并且可能加強(qiáng)每個(gè)人的創(chuàng)造能力與挖掘每個(gè)人的新需求,更不能隨意看好全球算力+軟件棧行業(yè)、模型+云計(jì)算行業(yè),應(yīng)用+傳感器行業(yè)。

GPT4在公開(kāi)情報(bào)分析方面具備超能力,這個(gè)能力遠(yuǎn)遠(yuǎn)大于搜索引擎,也超過(guò)了許多NSA數(shù)據(jù)武器(論證略),現(xiàn)在解決了多模態(tài)問(wèn)題,無(wú)論音視頻、圖片還是文字,機(jī)器人通吃。如果你要分析互聯(lián)網(wǎng)大數(shù)據(jù)的秘密,并且發(fā)現(xiàn)需要的情報(bào),那么GPT這樣的機(jī)器人是不是就會(huì)很有用處?

不光如此,微軟還要把旗下搜索引擎bing與GPT4融合。bing解決了AI訓(xùn)練所需的互聯(lián)網(wǎng)數(shù)據(jù)源問(wèn)題,GPT解決了數(shù)據(jù)分析輸出問(wèn)題,bing+GPT=new bing……

我想美國(guó)政府、情報(bào)機(jī)構(gòu)和軍方一定會(huì)積極買(mǎi)單。他們不光利用聊天機(jī)器人技術(shù)分析全球情報(bào),還可以偷偷地訓(xùn)練機(jī)器人撒謊。

GPT從1.0走了3.5,又從3.5走到4.0,而許多國(guó)家還在停留2.0-3.0的水平上,原地不動(dòng)。

眼下要錢(qián)沒(méi)錢(qián),要人沒(méi)人,要算力沒(méi)算力。跟是跟不上了,必須另辟蹊徑。

關(guān)鍵詞: