久久久久久婷_欧美日韩国产高清_国产日韩欧美一区二区三区_麻豆精品精品国产自在97香蕉_久久精品久久精品_日韩成人免费av_日韩国产精品久久久久久亚洲_日韩欧美专区_欧美日韩精品免费观看视频完整_一区二区三区成人精品

首頁 > 知識分享 > 知識分享 > LLM首次達到人類語言專家水平,OpenAI o1拿下拆解句法、識別歧義、推理音律

LLM首次達到人類語言專家水平,OpenAI o1拿下拆解句法、識別歧義、推理音律

發布時間:2025-11-08 18:08:45

LLM再下一城!伯克利研究證明:OpenAI的o1被證明也具有匹敵人類語言學家的元分析能力。

在人類諸多才能之中,哪些才是人類所獨有的?

自古希臘哲人亞里士多德以來,語言便被視為最能彰顯人之本性的標志。他曾言:人類乃「具有語言的動物」。

即使當今的大語言模型如ChatGPT已能在表層上模擬人類的日常言談,學者們依然追問:

在人類語言的深處,是否蘊藏著某些獨特的結構與特質,是任何其他生物的溝通方式,乃至AI的運算體系,皆無法真正企及的?

加州大學伯克利分校語言學家、羅格斯大學的攜手,讓多個大語言模型經受一系列語言學測試——其中包括要求模型歸納虛構語言的規則。

雖然大多數大語言模型未能像人類那樣解析語言學規則,但有一個模型展現出遠超預期的驚人能力。它能像語言學研究生那樣分析語言——劃分句子成分、解析多重歧義,并能運用遞歸等復雜語言學特征。

研究者Gašper Beguš表示,這一發現「挑戰了我們對人工智能能力的認知」。

AI會說話不稀奇,會解釋才稀奇——

如果語言是讓我們成為人類的關鍵,那么如今大語言模型獲得了「元語言」能力,這又意味著什么呢?

LLM構建無窮遞歸

想象一下:你在搭一座一層套一層、像俄羅斯套娃一樣的「句子塔」。

每套進一層,理解難度就指數級上升。

這種結構,在語言學里叫「中心嵌入」(center embedding),曾被知名語言學家喬姆斯基稱為能定義人類語言與思維的決定性特征。

比如這句話:

The worldview that the prose Nietzsche wrote expressed was unprecedented.

(大意為:尼采所寫的那篇散文所表達的世界觀是前所未有的。)

表面上看平平無奇,但如果你拆開它的「語言洋蔥」:

最外層:The worldview [...] was unprecedented(這個「世界觀」前所未有);

套進去一層:that the prose [...] expressed(是「那篇散文所表達的」);

再往里一層:Nietzsche wrote(而這篇散文是「尼采寫的」)。

這就像在一個句子中間,又塞進一個完整的句子,再在那個句子里塞進另一個句子——三層套娃,層層遞歸。

人類能理解這樣的句子,但之前,人們認為這樣的能力大模型不具備。

上述句子在真實對話中幾乎從未出現過——因為大家會覺得它「太繞了!」

所以,任何語言模型如果只是靠「背書」,根本不可能見過,自然也無法識別出這種例子。

語言學家們認為,人類語言從有限詞匯和有限規則中生成無限可能句子,這種能力歸因于無限遞歸。

迄今為止,還沒有令人信服的證據表明其他動物能夠以復雜的方式使用遞歸。

圖1:不同大模型識別多重遞歸,繪制正確語法樹的比例

圖1:不同大模型識別多重遞歸,繪制正確語法樹的比例

然而,該研究指出在眾多大模型中,唯有OpenAI o1模型不僅看懂包含多重遞歸的句子(圖1)。

o1不僅能如同語言學家那樣,以接近100%的正確率畫出正確的樹狀結構,還能將本就復雜的句子變得更多一層。

圖2:該句子對應的正確語法樹

圖2:該句子對應的正確語法樹

當它被問:「能不能再加一層遞歸?」o1回復:

The worldview that the prose that the philosopher Nietzsche admired wrote expressed was unprecedented.

「那位尼采所敬仰的哲學家所撰寫的散文所表達的世界觀是前所未有的。」

這說明o1不僅能夠使用語言,還能夠思考語言,具備元語言能力(metalinguistic capacity )。

由于語言模型只是在預測句子中的下一個單詞,人對語言的深層理解在質上有所不同。因此,一些語言學家表示,大模型實際上并沒有在處理語言。

這項研究的結論看起來是對上述觀點的否定。

大模型能區分歧義

也能深入理解句子

想象一下,你聽到下面的話:「Eliza wanted her cast out.」

乍一聽,好像就是「Eliza想把她的cast趕出去」?

但「cast」這個詞既可以是動詞(「驅逐」),也可以是名詞(「石膏」)!

于是這句話就有兩種不同的含義,分別是

Eliza想要她的石膏被拿出去,

Eliza想把她趕出去。

這樣識別包含多義性句子的能力,之前同樣被認為大模型不具備。

人類擁有很多常識知識,使我們能夠排除歧義。但大模型很難具有這樣的常識知識水平。

然而該研究表明,o1可正確識別兩種結構,并為每種生成了符合語言學規劃的句法樹。其他模型(如 GPT-4、Llama 3.1)只會生成不合語法的結構,還會對語義產生誤解。

該研究還考察了大模型在音韻學相關任務上的表現——

音韻學是研究聲音模式以及最小的聲音單位,即音素的組織方式。

例如,在英語中,給以「g」結尾的詞加上「s」會發出「z」的音,就像「dogs」一樣。但給以「t」結尾的詞加上「s」聽起來更像標準的「s」音,就像「cats」一樣。

該研究一口氣創建了30種新的迷你語言,以了解大模型是否能夠在面對新生成的虛擬語言時,在沒有任何先驗知識的情況下能不能正確推斷語音規則。

結果出人意料,即使是在這些虛構的語言上,o1在音韻相關的任務上表現依舊出色。

大模型比人類更好地理解語言嗎?

從上述三個例子可以看出,曾經那些被認為僅僅人類能夠擁有的語言理解能力,大模型如今也具備了。

2023 年著名語言學家喬姆斯基在《紐約時報》上寫道:「語言的正確解釋很復雜,不能僅僅通過浸泡在大數據中就能學會。」

該文認為盡管 AI 模型在運用語言方面可能很擅長,但它們并不具備以復雜方式分析語言的能力。

在此思潮影響下,即使ChatGPT在各方面上復制了自然語言,公眾仍想知道大模型是否有人類語言的特定特征能不能由大模型復現。

這當然很有必要,隨著社會越來越依賴大模型,了解它在哪些方面能成功以及哪些方面會失敗變得越來越重要。

語言分析是評估語言模型推理能力與人類相似程度的理想測試平臺。

而o1能夠以與語言學家相似的方式分析語言,例如繪制句子圖、解決多個歧義含義,并利用遞歸等復雜的語言特征

但我們發現這一現象后,人們不禁會問下面兩個問題:

第一個問題是為何只有o1可行,其它大模型表現都差一大截。

回答是相比其它模型,o1 的優勢很可能源于思維鏈(類似Deepseek的深度思考),使其能像人類語言學家一樣逐步推理、驗證假設、構建抽象規則。

第二個問題是當模型的性能隨著規模變大而變大時,大模型是否有一天會比我們更能準確的理解語言嗎?

對于這個問題的回答,目前還沒有定論。

一方面,任何的大模型在語言學上還沒有提出過原創性的觀點,也沒有教給我們關于語言的新知識。

另一方面,增加計算能力和訓練數據,語言模型最終會在語言技能上超越我們,   看不出有什么理由阻止語言模型展現出比我們更好的語言理解能力。

研究尚不足以宣稱「機器理解語言勝于人類」,但足以改變評價口徑:對模型的考察,應從「任務產出」轉向「結構解釋」。

當可解釋性成為首要指標,AI研究、教育與應用治理將迎來同一套標準——把「為什么對」放在「對不對」之前。

知識分享更多>>

3.2億元新訂單!佑駕創新智能座艙方案獲全球知名車企定點 FF任命企業家及私募股權投資人Shahryar Oveissi擔任戰略顧問 特斯拉將考慮自建芯片工廠;馬斯克萬億美元薪酬方案獲批;日產汽車上季度營業利潤轉正 馬斯克:特斯拉擬自建芯片工廠,并考慮與英特爾合作 捷豹路虎在中國市場的本地化進程,“全勤”參與進博會,其實也是外資車企與中國市場共同發展的一個縮影 豐田汽車第二財季利潤下降27% 聯想生態成員新增蘋果 iOS 設備,實現多端設備跨生態協同如一,同時全新超級互聯 3.0 現已發布 邁向十年,元氣森林2025經銷商大會釋放了哪些信號? AI創業再添“大宗師”,楊立昆確認離開Meta,新公司專注機器智能研究 乘風AI,快手已經開始迎來收獲期 當AI走向“解決問題”:平安如何打造“超級有用”的智能體? “全球輕型商用車領導者”是怎樣煉成的? 縱橫G700環塔版上市售33.49萬元起 20年沉淀品牌溫度,雷克薩斯詮釋何為豪華之道 小鵬X9超級增程上市 改寫增程技術與大七座市場雙重格局 鴻蒙智行2025壓軸車,新款享界S9 24小時小訂破5000臺 LLM首次達到人類語言專家水平,OpenAI o1拿下拆解句法、識別歧義、推理音律 硅谷華人女CEO殺入,全球首家AI影工廠引爆“AI韓流” TikTok Shop第3季度全球狂攬約190億美元,短視頻帶貨大獲成功 消息稱高通驍龍8 Gen5芯片暫定11月底發布 隔著屏幕真能聞到味兒了,“氣味電視”亮相 有幾百種味道 網友質疑淘寶“雙11霸屏廣告” 杭州市監:已收到舉報展開調查 DRAM漲價潮來襲,英偉達熱銷顯卡RTX 5060 Ti被曝供應告急 馬斯克:特斯拉將在一兩個月內開放“邊開車邊發短信”功能 消息稱榮耀第二塊萬級大電池試產,典型值9900mAh± 東方甄選孫東旭也走了!俞敏洪為什么學不了任正非? 豆包兇猛,深度解析字節AI戰略 eSIM手機成新趨勢,華為、vivo們的路徑分野 TikTok東南亞用戶超過4.6億,電商、商業化均數據亮眼 劉強東請京東騎手吃肯德基 犒勞京東雙11開門紅送單
久久久久久婷_欧美日韩国产高清_国产日韩欧美一区二区三区_麻豆精品精品国产自在97香蕉_久久精品久久精品_日韩成人免费av_日韩国产精品久久久久久亚洲_日韩欧美专区_欧美日韩精品免费观看视频完整_一区二区三区成人精品
亚洲综合小说| 欧美日韩水蜜桃| sm久久捆绑调教精品一区| 国产亚洲欧美日韩在线观看一区二区| 国产99久久| 国产综合色区在线观看| 国产69精品久久| 日本在线不卡一区| 亚洲一区亚洲| 中文字幕av一区二区三区四区 | 精品视频在线播放一区二区三区| 欧美久久天堂| 宅男在线一区| 最近国产精品视频| 先锋欧美三级| 最新日韩av| 亚洲宅男一区| 欧美黑粗硬大| 日av在线不卡| 黄色成人美女网站| 日本美女一区二区三区| 视频一区国产视频| 国产图片一区| 麻豆成人久久精品二区三区小说 | 日韩伦理精品| 免费视频国产一区| 成人在线网站| 欧美日韩导航| 欧美aⅴ一区二区三区视频| 91精品国产调教在线观看| 91麻豆国产自产在线观看亚洲| 里番精品3d一二三区| 国语精品视频| 欧美a一级片| 中文字幕高清在线播放| 成人三级视频| 国产精品久一| 欧美一区免费| 欧美亚洲日本精品| 日韩午夜av在线| 欧美调教在线| 日韩成人午夜| 国一区二区在线观看| 91天天综合| 91影院成人| 国产精品视频| 91成人精品| 久久精品不卡| 午夜视频在线观看精品中文| 欧美区亚洲区| 最新日韩欧美| 欧美日韩一区二区三区视频播放| 播放一区二区| 天天做综合网| 国产精品手机在线播放| 日韩成人影音| 免费高清在线视频一区·| 在线一区电影| 天天做天天爱综合| 亚洲先锋成人| 久久久久久美女精品| 国产日韩欧美一区二区三区| 欧美日韩1区| 麻豆成人在线观看| 国产精品久久久久久久久免费高清| 国产精品久久久久久影院8一贰佰| 最新亚洲激情| 99riav1国产精品视频| 欧美自拍一区| 日韩av中文在线观看| 国内自拍一区| а√天堂8资源中文在线| 日韩午夜高潮| 成人久久一区| 在线成人动漫av| 久久激情网站| 久久理论电影| 天堂资源在线亚洲| 久久婷婷丁香| 久久久久蜜桃| 激情综合久久| 伊人情人综合网| 宅男噜噜噜66国产日韩在线观看| 一本久道久久综合婷婷鲸鱼| 欧美网站在线| 日韩制服丝袜av| 日本久久综合| 五月天国产在线| 美女色狠狠久久| 国产一区2区在线观看| 懂色aⅴ精品一区二区三区| 在线成人直播| 欧洲乱码伦视频免费| 久久精品高清| 99精品在线观看| 玖玖玖免费嫩草在线影院一区| 国内精品久久久久久久久电影网| 亚洲成aⅴ人片久久青草影院| 亚洲综合图色| 精品三级av| 不卡av一区二区| 亚洲欧洲一区| bbw在线视频| 久久精品黄色| 999国产精品亚洲77777| 深夜视频一区二区| 麻豆一区二区在线| 999久久久国产999久久久| 国产亚洲一区二区三区不卡| 久久精品久久久精品美女| 久久国产三级精品| 99精品国产一区二区青青牛奶| 中文字幕日本一区二区| 欧美日韩国内| 国产一区日韩一区| 1024日韩| 国产精品成久久久久| 成人国产综合| 99亚洲男女激情在线观看| 欧美三区视频| 黄色欧美日韩| 不卡福利视频| 91成人精品观看| 亚洲视频国产| 黄色亚洲在线| 成人综合网站| 西野翔中文久久精品字幕| 精品理论电影在线| 久久国产高清| 成人亚洲网站| 日韩精品亚洲专区在线观看| 国产91精品对白在线播放| 国内露脸中年夫妇交换精品| 丝袜亚洲另类欧美综合| 日韩动漫一区| 91精品国产91久久久久久密臀| 一本久久综合| 免费一二一二在线视频| 在线观看亚洲| 国产精品玖玖玖在线资源| 牛夜精品久久久久久久99黑人| 亚洲欧洲高清| 日日夜夜精品视频天天综合网| 国内不卡的一区二区三区中文字幕| 亚洲伊人精品酒店| 999国产精品视频| 少妇视频在线观看| 欧美国产中文高清| 不卡一区2区| 美女爽到高潮91| 群体交乱之放荡娇妻一区二区| 欧美xxxx中国| 欧美电影在线观看一区| 欧美精品一卡| 国产欧美日韩一级| 免费看久久久| 国内精品99| 国产精品88久久久久久| av不卡免费看| 亚洲欧美日本国产专区一区| 欧美精品一卡| 亚洲全部视频| 青青久久av| 免费在线亚洲欧美| 久久裸体网站| 亚洲国产二区| 欧美一二区在线观看| 一区二区三区国产在线| 精品国产不卡| 777午夜精品电影免费看| 日本一区二区三区播放| 蜜臀av性久久久久蜜臀aⅴ| 亚洲人成777| 日本欧美在线看| 欧美猛男同性videos| 日韩中文字幕不卡| 中文字幕在线免费观看视频| 久久精品国产免费看久久精品| 成人在线视频www| 日韩伦理一区| 美女午夜精品| 影音先锋中文字幕一区二区| 91免费精品国偷自产在线在线| sm久久捆绑调教精品一区| 女优一区二区三区| 亚洲精品亚洲人成在线观看| 丁香婷婷久久| 激情黄产视频在线免费观看| 婷婷综合激情| www.亚洲一二| 国产美女精品视频免费播放软件| 高清av一区二区三区| 国产精品成人一区二区不卡| 亚洲第一毛片| 欧美色综合网| 亚洲传媒在线| 在线国产日韩| 久久女人天堂| 国产精选在线| 久久高清国产|