人工智能如何“說人話”？ ——對于自然語言處理研究的哲學(xué)反思

來源：樹人論文網(wǎng)發(fā)表時(shí)間：2021-12-20

簡要：摘要：目前的自然語言處理技術(shù)的發(fā)展，依然面臨如下問題：(1)不同的自然語言處理機(jī)制之間缺乏融合;(2)自然語言處理技術(shù)與人工智能研究的其他技術(shù)缺乏彼此融合;(3)基于大數(shù)據(jù)的自然語言

　　摘要：目前的自然語言處理技術(shù)的發(fā)展，依然面臨如下問題：(1)不同的自然語言處理機(jī)制之間缺乏融合;(2)自然語言處理技術(shù)與人工智能研究的其他技術(shù)缺乏彼此融合;(3)基于大數(shù)據(jù)的自然語言處理技術(shù)的運(yùn)作必須以“剝削”人類的智能為前提;(4)基于大數(shù)據(jù)的自然語言處理技術(shù)缺乏靈活處理隱喻、反諷、雙關(guān)等修辭現(xiàn)象的能力。這些問題所涉及的主要哲學(xué)問題有：(1)語言是外部世界的表征，還是言說者內(nèi)部世界的表征?(2)語言中的規(guī)則，究竟是先驗(yàn)的，還是經(jīng)驗(yàn)的?(3)語言表征與言說者的心理活動(dòng)之間的關(guān)系為何?(4)與語言表征有關(guān)的認(rèn)知構(gòu)架，在多大程度上需要被“具身化”?

　　關(guān)鍵詞：人工智能自然語言處理認(rèn)知語言學(xué) 語言哲學(xué) 大數(shù)據(jù) 圖式

自然辯證法通訊

　　徐英瑾; 陳萌自然辯證法通訊 2021-12-17

　　一、導(dǎo)論：為何對人工智能來說， “自然語言處理”非常重要?

　　概而言之，所謂“人工智能”(“Artificial Intelligence”，簡稱為“AI”)，就是用計(jì) 算機(jī)技術(shù)提供的技術(shù)手段，對人類智能進(jìn)行模擬或部分模擬的一門學(xué)科。而人類的智能活動(dòng)的一個(gè)非常重要的面相，用非常通俗的話說，就是“會(huì)說話”，也就是某種根據(jù)在特定語言共同體里通行的詞匯表與語法，進(jìn)行靈活的思想交流的能力。這種意義上的能力無疑是高等智慧生物之 “智慧性”的重要指標(biāo)，而且在我們已知的范圍內(nèi)，人類的確是唯一具備這種能力的物種(當(dāng)然，這并不是說諸如鸚鵡或者黑猩猩之類的生物無法掌握人類詞匯中的一部分，也并不是說它們沒有特定物種內(nèi)部有效的信息交流模式——然而，的確尚且沒有足夠扎實(shí)的證據(jù)表明：它們能夠像人類那樣，通過不同的句法組合方式，創(chuàng)生與理解大量在內(nèi)容上與其直接生存環(huán)境無關(guān)的語言表達(dá)式)。換言之，如果“會(huì)說話”乃是將人類智能與動(dòng)物智能區(qū)分開來的最重要的指標(biāo)之一的話，那么，完整意義上的AI顯然也應(yīng)當(dāng)具備這種特征。由此我們就能立即得出這樣的結(jié)論：對于AI研究來說，讓計(jì)算機(jī)能夠“說人話”，就將具有如下的重要理論意義：這樣的一項(xiàng)工作，將幫助我們從“人造認(rèn)知架構(gòu)”的角度理解語言能力在一個(gè)智能體系中所占據(jù)的地位，并由此夯實(shí)AI研究與廣義上的認(rèn)知科學(xué)之間的聯(lián)系。

　　而換個(gè)角度看，讓 AI“說人話”的科學(xué)與工程學(xué)努力，也會(huì)帶來豐厚的實(shí)踐紅利。很顯然，如果經(jīng)過特定編程的計(jì)算機(jī)也能夠理解人類的語言的話，這些機(jī)器就能直接參與人類的信息交流活動(dòng)，并由此成為人類工作與生活中的好幫手。概而言之，能夠“懂人話”的人工智能機(jī)器所能勝任的工作將包括(但不局限于)：

　　(甲)電子郵寄處理。譬如，在面對海量的電子郵件的時(shí)候，你會(huì)希望你的AI助手能夠通過對于郵件內(nèi)容的分析，鑒別出哪些郵件是需要迅速處理的，哪些則可暫緩處理，由此提高你的辦公效率;

　　(乙)自動(dòng)生成閱讀摘要。譬如，如果有一篇文章實(shí)在太長，讓你覺得無法迅速通讀，你便會(huì)希望你的AI助手能夠迅速形成一份內(nèi)容提要，以便讓你迅速把握文章之要點(diǎn);(丙)自動(dòng)翻譯。譬如，你要讓計(jì)算機(jī)將一段電子郵件的內(nèi)容自動(dòng)翻譯成一種你不會(huì)的語言——如韓語或者日語——或者將一段你不懂的外語表述翻譯成漢語;(丁)文本自動(dòng)生成。譬如，你需要為公司的某次年會(huì)準(zhǔn)備一份發(fā)言稿，卻除了一些關(guān)鍵詞或詞組(如“業(yè)績”“維持增長的勢頭”“優(yōu)化研發(fā)隊(duì)伍”)之外，什么句子都想不出。這時(shí)候，你便會(huì)希望你的AI助手能夠根據(jù)這些提示，給出一些不同方向上的文本生成方案，以供你參考。而當(dāng)你選定某個(gè)方案之后，你的AI 助手甚至可以沿著這一路徑繼續(xù)優(yōu)化相關(guān)的文本方案，最后幫你“多快好省”地完成發(fā)言稿。

　　在AI學(xué)界，負(fù)責(zé)完成上述任務(wù)的計(jì)算機(jī)編程研究，都會(huì)被打上“自然語言處理”(Natural Language Processing，簡稱為“NLP”)的標(biāo)簽。顧名思義，“自然語言處理”(NLP)的任務(wù)，就是用計(jì)算機(jī)進(jìn)行編程，以便讓相關(guān)程序能夠 “理解”人類的自然語言(不過，這里的“理解” 二字必須要打上引號，因?yàn)閷τ谟?jì)算機(jī)是否可能最終“理解”人類語言，尚且存在著非常復(fù)雜的哲學(xué)爭議)。NLP 研究因?yàn)樯婕暗脑掝}非常多，復(fù)雜性、綜合性特別強(qiáng)，所以一向被視為AI研究的皇冠(參看圖1對于NLP所涉及的知識模塊的概括)。[1] 不過，說到這里，愛較真的讀者或許會(huì)問： “會(huì)說話”能算是“具有智能”的充分必要條件嗎?

　　筆者傾向于認(rèn)為答案是肯定的。換言之，如果某觀察對象能夠具有我們認(rèn)可的語言水平(即達(dá)到了“會(huì)說話”的標(biāo)準(zhǔn))，你就能推出它有智能;反過來說，如果它是有智能的，你就能反過來斷定它有比較高的語言水平。舉例來說，假設(shè)某星系的外星人突然造訪地球，還流利地運(yùn)用英語、漢語、日語等三種語言與我們進(jìn)行了長達(dá)2小時(shí)的富有成效的交談——在這樣的情況下，我們地球是沒有任何理由認(rèn)為它們是缺乏智能的。反過來說，如果外星人的確造訪了我們的星球，并在近地軌道懸停了它們的飛碟，但因?yàn)槟撤N原因暫時(shí)沒有與我們建立語言聯(lián)絡(luò)的話，那么我們也的確必須假設(shè)它們是有語言的——因?yàn)樘热魶]有語言在生產(chǎn)活動(dòng)的分工協(xié)作中所起到的作用，如此復(fù)雜的飛碟恐怕是無法被制造出來的。

　　這里需要提醒讀者注意的是，筆者雖然認(rèn)為“會(huì)說話(無論說哪種語言)”是“具有智能” 的充分必要條件，但這并不意味著“能說某種特定的人類語言(如漢語或英語)”乃是“具有智能”的充分必要條件。這就好比說，你與某個(gè)異族的人交流的時(shí)候，恐怕是不能僅僅因?yàn)楸舜酥g語言不通而假設(shè)對方是缺乏智能的。由此外推，我們甚至可以說：即使某些機(jī)器人的AI架構(gòu)所支撐的交流語言的可理解性已經(jīng)落在了廣大人類用戶的理解范圍之外，我們也不能僅僅以此為據(jù)，認(rèn)定這些機(jī)器人缺乏智慧。或說得更學(xué)術(shù)化一點(diǎn)，是否能夠通過“圖靈測驗(yàn)”，[2] 并非是判斷某對象是否具有智能的充分必要條件(而至多只能算是充分條件)。由此我們也就不難推出，雖然我們的NLP研究將不得不具有“為說特定自然語言的人類用戶服務(wù)”的最終指針，但是作為某種研究的中介階段，我們所設(shè)計(jì)的系統(tǒng)所進(jìn)行的語言表征，可能并不直接就是諸如英語、漢語這樣的現(xiàn)成的人類語言。相反，NLP的研究者所要正面的，可是一個(gè)從表征的碎片演化為完整的人類符號系統(tǒng)的復(fù)雜過程。請參看圖2對于目前主流 NLP架構(gòu)的信息處理階段的概括。對于本小節(jié)所給出的上述討論，有的讀者或許還會(huì)反駁說：筆者將語言處理能力視為智能之核心的觀點(diǎn)，顯得有點(diǎn)過于“邏各斯中心主義”了，并由此忽略了“具身化”(embodiment)在智能構(gòu)成所起到的作用。換言之，在這些人看來，一個(gè)智能體之所以是智能的，首先并不在于其能說話，還是因?yàn)槠淠軌蛲ㄟ^其身體，而在物理空間中自由移動(dòng)，感知光線、氣味與溫度，躲避危險(xiǎn)，等等。“會(huì)說話”無疑是第二位的。

　　而在筆者看來，上面這種批評，并沒有抓到我的立論的核心。換言之，說“會(huì)說話是具有智能的充分必要條件”，并不等于說要去否認(rèn)：使得“會(huì)說話”這一條件本身被滿足，還需要大量的前提條件。這就好比說，承認(rèn)“具有相關(guān)行業(yè)內(nèi)三年以上的工作經(jīng)歷，乃是獲得某工作職位的最重要條件”，并不意味著要去否認(rèn)“具有相關(guān)行業(yè)內(nèi)三年以上的工作經(jīng)歷” 這一條件自身的滿足，還需要奠基在大量的前提性條件之上。相反，筆者完全愿意承認(rèn)“具身性”自身的確構(gòu)成了“會(huì)說話”的一個(gè)重要前提。譬如，《莊子·外篇·秋水》所說的“夏蟲不可以語于冰者，篤于時(shí)也”一語，實(shí)際就已涉及到了說話者的身體感受力之局限對于其語言理解力的制約。不過，對于莊子所言的上述闡發(fā)，同時(shí)也反過來支持了筆者的觀點(diǎn)：如果你發(fā)現(xiàn)某個(gè)對象在言語層面上無法“與之語冰”，這就很可能進(jìn)一步說明：該對象在感知層面上就無法感受到冰天雪地的時(shí)節(jié)。這也就是說，語言交流的結(jié)果，依然能夠有效地反映一個(gè)“疑似智能體”的智能架構(gòu)在非語言層面上所接觸的信息的廣度與深度。與之相比較，對于某對象的純粹的非言語身體行為的記錄，卻往往不能讓觀察者判斷出對象的某些抽象能力的高低。譬如，一位哲學(xué)教授肯定無法通過一位學(xué)生的純肢體動(dòng)作來判斷他是否讀懂了康德的《純粹理性批判》，而只能通過筆試或口試等言語活動(dòng)來完成這種此類判斷。從這個(gè)角度看，從言語行為——而不是從身體行為——的角度出發(fā)來評判被觀察對象的智能水平，是具有其特有的方法論優(yōu)勢的。由此外推，我們也不難得出：就人造智能體而言，其在NLP領(lǐng)域的表現(xiàn)水平，也應(yīng)當(dāng)對其整體智能水平具有指標(biāo)意義。說“NLP 研究乃是 AI 研究的王冠”，毫無夸張之處。

　　二、目前的人工智能發(fā)展水平，是否能夠滿足“說人話”的需求呢?

　　前文已經(jīng)指出，NLP研究乃是AI研究的王冠，具有極大的理論綜合性與市場應(yīng)用價(jià)值。目前，也已經(jīng)有大量的研究資源已經(jīng)被投入到這個(gè)領(lǐng)域，產(chǎn)生了大量的商業(yè)產(chǎn)值。譬如，智能語音音箱、手機(jī)上裝載的各種人機(jī)對話應(yīng)用軟件、“百度翻譯”“谷歌翻譯”，都是此類研究的重要成果。但是需要指出的是，此類產(chǎn)品的表面上的繁榮，并不意味著目下的NLP產(chǎn)品已經(jīng)達(dá)到了“會(huì)說人話”的水準(zhǔn)。其評判理由是：

　　第一，諸如“谷歌翻譯”這樣的機(jī)器翻譯機(jī)制、“亞馬遜理解器”(Amazon Comprehend)這樣的文本信息挖掘機(jī)制、各種自動(dòng)語音識別機(jī)制與各種各樣的機(jī)器人聊天盒，都是針對不同的NLP任務(wù)而被設(shè)計(jì)出來的特定 NLP機(jī)制，而不是某種面面俱到的針對所有NLP問題的一攬子解決方案。與之相較，對于一個(gè)完整的自然人而言，語義識別、語音識別、翻譯等語言功能都是被集成到一個(gè)大腦上的，其各自運(yùn)作背后均有一套統(tǒng)一的心理學(xué)與生理學(xué)規(guī)律予以統(tǒng)馭。從便利角度考慮，我們當(dāng)然也會(huì)期望這種整合能夠在NLP中實(shí)現(xiàn)。換言之，就像一個(gè)僅僅能做翻譯，而無法用母語對被翻譯文本進(jìn)行深度解說的翻譯者不能算作是已經(jīng)真正理解了被翻譯文字一樣，某種僅僅能做淺層翻譯，而不能進(jìn)一步解釋被翻譯文字的NLP機(jī)制，也不算是真正在“說人話”。然而，基于下述兩點(diǎn)理由，在NLP中，這樣的技術(shù)整合非但沒有出現(xiàn)，而且似乎在可以預(yù)見的未來，也不太可能出現(xiàn)：(甲)具有不同分工的NLP機(jī)制往往分屬于不同的公司，因此，知識產(chǎn)權(quán)方面的壁壘會(huì)導(dǎo)致彼此的融合困難;(乙)具有不同分工的 NLP機(jī)制的研發(fā)往往本身又是基于不同的技術(shù)原理的，因此，原理方面的彼此不兼容也會(huì)導(dǎo)致彼此的融合困難。

　　第二，就人類而言，人類的語言能力本身是用來“做事情的”，比如幫助語言使用者在決策活動(dòng)中進(jìn)行復(fù)雜的信息梳理，或者是幫助語言使用者去說服某人采取某種行動(dòng)。所以，語言能力天然就與邏輯推理能力、他心感知能力等其他心智能力相互交織。然而，就目前AI 工業(yè)的學(xué)術(shù)分工情況而言，NLP的研究與常識推理、非演繹推理等技術(shù)模塊之間的關(guān)系是相對分離的，遑論實(shí)現(xiàn)前文所提到的“具身性” 條件對于言語理解力的約束機(jī)制(圖3)。[3] 所以，從“通用人工智能研究”——而不是“專用人工智能研究”——的角度看，目前的NLP 研究乃是“無根”的。

　　第三，傳統(tǒng)的AI研究主要分“基于規(guī)則的 AI”與“基于統(tǒng)計(jì)的 AI”這兩大路數(shù)，而隨著時(shí)間的推移，目前以深度學(xué)習(xí)技術(shù)為代表的 “基于統(tǒng)計(jì)的AI”正在AI研究的各個(gè)領(lǐng)域內(nèi)大行其道，并在風(fēng)頭上全面壓過了“基于規(guī)則的 AI”(相關(guān)內(nèi)容后文還要詳談)。但需要注意的是，深度學(xué)習(xí)技術(shù)在NLP領(lǐng)域內(nèi)的運(yùn)用，往往需要依賴網(wǎng)絡(luò)提供大量的語料與學(xué)習(xí)樣本，而這些語料與學(xué)習(xí)樣本的最終提供者畢竟還是人類。因此，從哲學(xué)角度看，此類技術(shù)只能算是對于人類智慧的“反光映照體”(這就好比月亮無非就是太陽的“反光映照體”一樣)，而無法真正成為語言智慧的根基。譬如，這樣的技術(shù)很難在脫離互聯(lián)網(wǎng)的支持的前提下，自主地創(chuàng)生出對于輸入語料的恰當(dāng)處理結(jié)果——而與之相較，具有正常語言智能的人類卻能在不借助網(wǎng)絡(luò)資源的情況下進(jìn)行流暢的語言交流。因此，目前的主流NLP研究乃是缺乏足夠強(qiáng)大的“本地化信息處理能力”的。

　　第四，也正是因目前的主流 NLP 技術(shù)與大數(shù)據(jù)的信息采錄具有非常密切的關(guān)聯(lián)，一些在原則上就很難通過大數(shù)據(jù)技術(shù)獲得的語言材料，也就很難獲得目下主流NLP技術(shù)的充分處理。這些材料包括：

　　(甲)人類語言中的雙關(guān)、隱喻、反諷等修辭手段。具體而言，對于這些表達(dá)式的意義的確定往往需要結(jié)合當(dāng)下的語境來進(jìn)行，而無法通過基于大數(shù)據(jù)的歸納而被倉促?zèng)Q定。(乙)缺乏足夠網(wǎng)絡(luò)數(shù)據(jù)樣本的弱勢語言，如少數(shù)民族語言與地方方言。具體而言，對于這些語料的傳統(tǒng)NLP處理方式往往是基于“語料庫”的建設(shè)的(此類建設(shè)需要人類研究者投入大量的精力遴選語料)，而不能簡單地訴諸于網(wǎng)絡(luò)資料，因?yàn)槟壳暗木W(wǎng)絡(luò)語言乃是由英語、漢語等主流語言所主導(dǎo)的。然而，也恰恰是因?yàn)槟壳盎谏疃葘W(xué)習(xí)的NLP技術(shù)對于網(wǎng)絡(luò)語料的依賴性非常高，所以，此類NLP技術(shù)恐怕是很難支持主流語言與弱勢語言之間的自動(dòng)翻譯處理的。

　　與之相較，具有適當(dāng)語言智力的人類，卻能比較快地通過語境信息提取而理解特定的雙關(guān)語、隱喻與反諷的含義，或者通過一定時(shí)期的努力，僅僅通過少數(shù)幾個(gè)教學(xué)者的幫助，學(xué)會(huì)一門方言。僅就這方面的表現(xiàn)而言，目前 NLP的研究所達(dá)到的水平，還遠(yuǎn)遠(yuǎn)沒有達(dá)到人類語言智力的平均水平。筆者認(rèn)為，目前NLP技術(shù)所面臨的這些問題，不僅僅基于這樣的或那樣的工程學(xué)問題，而是有著深刻的哲學(xué)面相的。換言之，在基本的哲學(xué)層面上所遭遇的迷思，是目下NLP研究陷入的種種的工程學(xué)難題的總的病根。下面就是筆者對這一問題的幾點(diǎn)管見。

　　三、為何自然語言處理研究需要哲學(xué)視角的介入?

　　從總體上來看，哲學(xué)與NLP研究之間的關(guān)系，與哲學(xué)和一般意義上的理工科研究規(guī)劃之間的關(guān)系，并無本質(zhì)不同。這也就是說，與很多自然科學(xué)研究規(guī)劃一樣，不同的NLP研究規(guī)劃都已經(jīng)預(yù)設(shè)了這樣的或者那樣的哲學(xué)立場，只是相關(guān)的實(shí)證科學(xué)研究者往往沒有興趣對這樣的立場進(jìn)行反思罷了。因此，哲學(xué)研究者的任務(wù)，就是將NLP研究未及言明的前提予以揭露，并對其進(jìn)行反思性的評判。需要注意的是，與別的實(shí)證研究領(lǐng)域不同，NLP的研究尚且具有很大的前沿性、綜合性、探索性與范式層面上的不確定性，這就意味著以綜合性反思見長的哲學(xué)反思介入NLP討論的機(jī)會(huì)，要比其介入物理學(xué)、化學(xué)等成熟學(xué)科的機(jī)會(huì)大很多。大致而言，由于 NLP 的研究將不得不預(yù)設(shè)這樣的或者那樣的關(guān)于語言之本性的看法，作為哲學(xué)分支的語言哲學(xué)(philosophy of language)與 NLP研究之間的關(guān)系就會(huì)變得異常相關(guān)。其中，有如下四個(gè)問題是特別值得一提的：

　　問題一：語言與世界的關(guān)系為何?語言表征是對于說話者之外的外部世界的建模，還是對于說話者自己的內(nèi)部觀念世界的建模?

　　這個(gè)問題顯然牽涉到語言哲學(xué)歷史上的一個(gè)大爭議。像柏拉圖、弗雷格、克里普克、普特南這樣的帶有客觀主義傾向的我哲學(xué)家會(huì)傾向于認(rèn)為語言的作用是成為外部客觀事物的標(biāo)記符號;而像洛克、胡塞爾、大森莊藏這樣的帶有主觀觀念論色彩的哲學(xué)家則會(huì)認(rèn)為語言的主要任務(wù)乃是表征言說者內(nèi)部的思想觀念，而不是指稱外部的對象。此類爭議在NLP內(nèi)部也引發(fā)了相關(guān)技術(shù)路徑的分野。其中，客觀主義路向的語言觀會(huì)自然導(dǎo)致諸如“沙德魯”這樣的利用一階謂詞邏輯構(gòu)造“積木世界”的NLP 方案;[4] 而主觀主義路向的語言觀則會(huì)引發(fā)丘其蘭德的“神經(jīng)語義學(xué)”規(guī)劃，[5] 以及在“個(gè)性化營建”方面走得更遠(yuǎn)的王培的“納思”研究規(guī)劃。[6] 說得更具隱喻色彩一點(diǎn)，這兩類研究路線之間的差異，乃是“上帝視角”與“凡人視角”之間的差異：基于“上帝視角”的客觀主義的NLP研究路向會(huì)預(yù)設(shè)：程序員已經(jīng)獲得了其關(guān)于外部世界的至少某些方面的充分知識;而基于“凡人視角”的主觀主義的NLP研究路向則會(huì)預(yù)設(shè)：程序員所知道的，僅僅是被構(gòu)建的NLP體系內(nèi)部的表征符號之間的推理關(guān)系——至于這些推理關(guān)系是否嚴(yán)格對應(yīng)于外部世界中的諸要素之間的因果關(guān)系，則是“未知之事”。

　　筆者是“凡人視角”的NLP研究路向的支持者，否則，我們就不得不預(yù)設(shè)NLP系統(tǒng)所儲(chǔ)存的某些關(guān)于外部世界的知識乃是“不可變的” (因?yàn)閷τ谥R的充分性假設(shè)，將立即導(dǎo)出對于“知識修正”的必要性的否定)，并由于這種預(yù)設(shè)而使得由此被設(shè)計(jì)出來的NLP系統(tǒng)失去應(yīng)有的靈活性。但不幸的是，基于“凡人視角” 的 NLP 研究，目前并非 NLP 研究的主流。因此，哲學(xué)家就特別需要在概念層面上進(jìn)行相關(guān)的“糾偏”工作。

　　問題二：語言中的規(guī)則，究竟是先驗(yàn)的、不可變的，還是經(jīng)驗(yàn)的，可變的?

　　前面已經(jīng)提到，NLP研究素有“基于規(guī)則” 與“基于統(tǒng)計(jì)”這兩個(gè)分野。但從概念分析角度看，對于這兩個(gè)分野自身的界定，似乎也就預(yù)設(shè)了“規(guī)則”的確立本身是與經(jīng)驗(yàn)性的統(tǒng)計(jì)工作無關(guān)的。但事情果真是如此嗎?難道一種語言的語法本身是不能隨著時(shí)間而發(fā)生流變嗎(我們不妨就想想近代以來漢語的語法所經(jīng)歷的“歐化”進(jìn)程)?關(guān)于如何更好的界定“先驗(yàn)” 與“經(jīng)驗(yàn)”之間的分界，大致有以下三種解答方案：

　　(甲)做大“先驗(yàn)”的范圍，即將所有的經(jīng)驗(yàn)層面上的自然語言語法都視為先驗(yàn)的。不過，這種研究方式由于實(shí)在難以配合經(jīng)驗(yàn)語法在事實(shí)層面上的演化現(xiàn)實(shí)，而只能被視為某種抽象的可能性。(乙)與(甲)所提示的方向相反，做大“經(jīng)驗(yàn)”的范圍，即認(rèn)為所有的先驗(yàn)語法都可以通過統(tǒng)計(jì)資料甲乙消化。這是目下主流的基于深度學(xué)習(xí)的NLP研究的思路。(丙)與前二者都不同，此路數(shù)取其中間值，即在“規(guī)則”中又一分為二：有些規(guī)則是“經(jīng)驗(yàn)的”，如各種語言的表層語法;有些規(guī)則是先驗(yàn)的，如某種貫穿于各種表層語法的“深層語法”。喬姆斯基的基于“普遍語法”概念的語言學(xué)路數(shù)，[7] 以及受到該路數(shù)影響的NLP研究，采用的就是該思路。

　　筆者本人所贊成的立場，乃是路數(shù)(丙)的某種更偏向經(jīng)驗(yàn)論方向的改良版。與喬姆斯基類似，筆者也認(rèn)為存在著某種貫穿于各種經(jīng)驗(yàn)的語言形式的先驗(yàn)思想架構(gòu)，否則我們就很難解釋為何任何一個(gè)智力正常的人都可能學(xué)會(huì)任何一門外語;但與喬姆斯基不同的是，筆者并不認(rèn)為這樣的一種先驗(yàn)思想架構(gòu)必須體現(xiàn)為一種現(xiàn)成的深層語法或普遍語法——它應(yīng)當(dāng)只能在某種更抽象的意義上被理解為簡單語言符號之間進(jìn)行“接榫拼接”的各種先驗(yàn)可能性，并因此只能承載最少的語法性質(zhì)(“語法性質(zhì)”一詞在此是指性、數(shù)、格等語法形態(tài))。舉個(gè)例子來說，印歐語系的語言經(jīng)常出現(xiàn)的名詞的性、數(shù)、格的變化、動(dòng)詞詞尾的情態(tài)與時(shí)態(tài)變化，都不能在這些最基礎(chǔ)的“接榫”形式中出現(xiàn)，而只能被視為這些“接榫”形式的某種后天的復(fù)合形式。與之相較，喬姆斯基本人的想法則是這樣的：即使在漢語這樣的屈折度幾乎不可見的東方語言中，上述這些印歐語言的語法“曲折性” 特點(diǎn)也是以緘默方式存在的，否則，他心目中的“深層語法”就無法達(dá)成其普遍性。或說得概括性更強(qiáng)一點(diǎn)，筆者與喬姆斯基之間的共同點(diǎn)就在于：我們都認(rèn)為對于所有語言的構(gòu)成的終極說明卻都可以訴諸于一套統(tǒng)一的語法范疇;而筆者與他的不同之處就在于：在他看來，既然有待說明的諸語言現(xiàn)象有繁、簡之分，那么，用以說明它們的語法范疇就必須在“繁”的一頭留足“冗余量”，并由此成為了一種預(yù)備了所有語法開關(guān)的“普遍語法”;而筆者卻不贊同這一判斷。筆者的反駁如下：倘若上述假設(shè)是對的，那么我們就可以由此推出：一個(gè)漢語言說者倘若是改去言說某種更復(fù)雜的語言(如日語)的話，這種轉(zhuǎn)換應(yīng)當(dāng)是不會(huì)給他帶來更大的心理學(xué)負(fù)擔(dān)的，因?yàn)樗男闹且呀?jīng)具備了言說這種更為復(fù)雜的語言的潛在語法開關(guān)。然而，這一推理顯然難以契合于下述這一樸素的心理學(xué)事實(shí)：言說在語法上更為復(fù)雜的語言一般會(huì)讓人感到更有心理負(fù)擔(dān)(除非那種更復(fù)雜的語言恰好是母語)。與之相較，筆者的假設(shè)——簡單的卯榫結(jié)構(gòu)能夠按照不同經(jīng)驗(yàn)語言的需要，隨時(shí)被搭建為特定的語法結(jié)構(gòu)——則可以輕易地解釋為何我們在言說語法更簡單的語言時(shí)會(huì)感到更輕松：因?yàn)檫@種言說所需要的卯榫結(jié)構(gòu)的重構(gòu)工作負(fù)荷本來就比較小。此外，筆者的這一研究思路還會(huì)帶來一個(gè)重大的紅利：由于筆者所說的這一卯榫結(jié)構(gòu)與邏輯句法結(jié)構(gòu)之間的高度同源性，經(jīng)由此路數(shù)進(jìn)行的NLP研究，將有機(jī)會(huì)與AI研究的其他面相(特別是推理與常識表征研究)相互融合。順便說一句，目前最切合筆者上述思路的NLP編程語言，其實(shí)就是前文提到的王培的“納思”邏輯，因?yàn)檫@種邏輯既具備對各種推理形式與常識經(jīng)驗(yàn)的表征能力，也可以通過對于自身結(jié)構(gòu)的遞歸式構(gòu)造，而去模擬特定經(jīng)驗(yàn)語言的語法特征。[8]

　　問題三：語言與心理架構(gòu)的關(guān)系之間的關(guān)系究竟是什么?

　　前面已經(jīng)提到，目前基于大數(shù)據(jù)的NLP研究，基本上乃是與各種各樣的認(rèn)知建模研究相互疏離的。換言之，這些 NLP 研究者所關(guān)心的是，乃是如何在某些特定類型的語料輸入與語料輸出之間建立起合適的映射關(guān)系，而并非是這樣的語言現(xiàn)象是從怎樣的心理認(rèn)知架構(gòu)之中涌現(xiàn)的。與之相較，對于語言與心理活動(dòng)之間的關(guān)系的研究，卻成為了戰(zhàn)后很多哲學(xué)家的學(xué)術(shù)聚焦點(diǎn)。譬如，在美國哲學(xué)家塞爾(John Searle)看來，諸如“提出一個(gè)希望”“表達(dá)一個(gè)欲望”“表述一個(gè)信念”這樣的言語行為本身乃是建立在“希望”“欲望”與“相信”這樣的“意向性活動(dòng)”之上的，因此，作為心理學(xué)哲學(xué)分支的“意向性理論”應(yīng)當(dāng)為作為語言哲學(xué)分支的“言語行為理論”提供根基。[9] 無獨(dú)有偶，福多(Jerry Fodor)也在心理學(xué)哲學(xué)層面上提出過關(guān)于“心語”(mentalese)的假設(shè)，以便在一個(gè)前公共語言的層面上解釋心智機(jī)器是如何加工處理那些基本信息的。[10] 而在筆者看來，雖然塞爾與福多各自的心理學(xué)哲學(xué)都有自己特定的問題，但至少他們都正確地看到了“純粹地停留在言語行為的層面上來研究語言”這一做法的膚淺性，而走出了邁向正確的NLP解決路徑的第一步。而之所以說“純粹地停留在言語行為的層面上來研究語言”這一做法本身乃是膚淺的，則又是基于如下考慮：在言語行為層次上的現(xiàn)象實(shí)在是過于繁雜了，因此，對于不同語言現(xiàn)象的輸入-輸出關(guān)系的追索，必然會(huì)使得NLP的研究者陷入“以有涯追無涯”的尷尬境地，并由此帶來昂貴的數(shù)據(jù)采集成本與建模成本;而如果我們換一個(gè)思路，將復(fù)雜的言語行為視為“某種更具有一般性的心智架構(gòu)在不同外部環(huán)境的刺激下而產(chǎn)生的不同的對應(yīng)輸出”的話，我們就能大大降低我們的建模成本，并為相關(guān)系統(tǒng)在特定外部條件下的自動(dòng)升級預(yù)留邏輯空間。

　　但這樣的一種研究思路，必然會(huì)將主流的 NLP研究的進(jìn)路，進(jìn)一步升級為一個(gè)宏大的通用人工智能的研究規(guī)劃，因?yàn)樾闹墙１旧砭鸵馕吨鴮τ谥悄艿囊话慵軜?gòu)的探索。這種帶有整體論思維模式色彩的研究路線圖恐怕會(huì)讓一部分研究者感到絕望，因?yàn)锳I研究的典型操作模式便是針對某個(gè)特定應(yīng)用場景提出的問題進(jìn)行工程學(xué)開發(fā)，并將相關(guān)的研究成果拓展到別的應(yīng)用場景上去——而筆者所提倡的研究思路卻是先去懸置一切技術(shù)應(yīng)用場景，而在哲學(xué)與科學(xué)的層面上理清智能推理的一般特征，然后再考慮技術(shù)運(yùn)用的問題。不過，在筆者看來，這里我所提出的研究路線圖雖貌似在繞彎路，卻實(shí)際上更有希望，因?yàn)樵撀肪€圖的執(zhí)行者能夠在最大程度上避免受到特定應(yīng)用場景的偶然性的影響，而能聚焦于心智架構(gòu)的某些一般性特征。這就好比是對于牛頓力學(xué)體系的純粹理論研究與基于該力學(xué)體系的各種工程學(xué)應(yīng)用之間的關(guān)系：前一類研究雖然具有某種凌駕于各種應(yīng)用場景的純理論性，但一旦完成，就可以轉(zhuǎn)變?yōu)闊o窮無盡的應(yīng)用可能，而起到“四兩撥千斤”的作用。

　　不過，這種面向“通用人工智能”的、帶有整體論色彩的研究規(guī)劃，顯然會(huì)因?yàn)樽陨淼恼w論色彩而從心理建模層面自然延展到身體建模層面。這也就會(huì)自然牽涉到前面我們所已經(jīng)提到過的那個(gè)問題：語言表征與具身性之間的關(guān)系究竟是什么?

　　問題四：自然語言處理所需要的認(rèn)知架構(gòu)理論，究竟在多大程度上還需要被“具身化”?

　　在前文中，通過“夏蟲不可語冰”這一案例，筆者已經(jīng)提出了這樣一種觀點(diǎn)：語言交流足以讓我們判斷一個(gè)交流對象在身體感知方面的廣度與深度，因此，語言交流乃是判斷某對象的各方面智能水平的最有效手段。然而，從工程建模的角度看，這并不意味著對于智能體的物理身體的塑造就可以被還原為純粹NLP性質(zhì)的問題——這就好比說，在認(rèn)識論的層面上說什么“美食家的評論乃是判斷某餐廳招牌菜之品質(zhì)的最重要指標(biāo)”，并不意味著在本體論意義上我們業(yè)要承認(rèn)：如何做出美食料理的問題，就可以被還原為如何撰寫美食評論的問題。由此看來，完整意義的通用人工智能研究，將不得不包含對于智能體的感受-運(yùn)動(dòng)設(shè)備(即人類意義上的“身體”)的設(shè)計(jì)與制造。

　　不過，至少從表面上看來，對于AI的感受運(yùn)動(dòng)設(shè)備的設(shè)計(jì)與制造，本身并不會(huì)引發(fā)任何哲學(xué)爭議，因?yàn)榫瓦B最簡單的家用計(jì)算機(jī)都包含著鍵盤、鼠標(biāo)等與外部信息環(huán)境溝通的媒介，遑論是需要在復(fù)雜物理環(huán)境中行動(dòng)的AI系統(tǒng)。那么，我們將這個(gè)問題予以單列，其意義究竟又為何呢?

　　其意義就在于對于下述問題的澄清：上述這種“具身化”的工作，究竟對于NLP的研究來說是具有本質(zhì)性的，還是僅僅具有某種邊緣性的意義?說得更清楚一點(diǎn)，在NLP的研究中，架構(gòu)者是否預(yù)先需要思考相關(guān)的AI體將被匹配上怎樣的感受-運(yùn)動(dòng)設(shè)備，并為這樣的設(shè)備而在NLP的界面上預(yù)留一些重要的“槽口”?抑或：架構(gòu)者根本不用關(guān)心相關(guān)的AI體將被匹配上怎樣的感受-運(yùn)動(dòng)設(shè)備，并完全可以將此類的考慮全部分配給別的領(lǐng)域內(nèi)的專家?而這個(gè)“二選一”問題在近代哲學(xué)中的表現(xiàn)形式就是：人類的理性能力，是否能夠在懸置各種感官能力的運(yùn)作的情況下，進(jìn)行相對獨(dú)立的運(yùn)作?對這一問題答“否”的乃是經(jīng)驗(yàn)派的觀點(diǎn)(這種觀點(diǎn)的工程學(xué)對應(yīng)者，自然就會(huì)強(qiáng)調(diào)NLP界面設(shè)計(jì)與AI體的外部設(shè)備設(shè)計(jì)之間的連續(xù)性)，而對該問題答“是”的，則是唯理派的觀點(diǎn)(這種觀點(diǎn)的工程學(xué)對應(yīng)者，自然就會(huì)強(qiáng)調(diào)NLP界面設(shè)計(jì)與AI體的外部設(shè)備設(shè)計(jì)之間的可分離性)。

　　筆者對于該問題的解答，則既不是純粹唯理論的，也不是純粹經(jīng)驗(yàn)論的，而是帶有康德式的調(diào)和意味的：在筆者看來，在純粹的概念構(gòu)造與底層的感官信息之間，還有一個(gè)重要的中間層被唯理派與經(jīng)驗(yàn)派所忽略了，這也就是時(shí)-空關(guān)系的直觀形式。一方面，這樣的直觀形式顯然具有一定的前概念性(譬如，對于一個(gè)房間的空間感知，不能被還原為對于相關(guān)空間的幾何學(xué)描述)，而在另一方面，這樣的直觀形式又具有針對各種感官道的某種抽象性，并因此更接近于概念(譬如，一位盲人所感知到的教室的內(nèi)部空間形式，依然會(huì)與一個(gè)正常人所看到的教室的內(nèi)部空間形式有著高度的可重疊性)。在現(xiàn)代的認(rèn)知語言學(xué)中，這樣的直觀形式的不同組合方式，一般稱為“圖型”(順便說一句，該術(shù)語乃是認(rèn)知語言學(xué)對于康德的“圖型”概念進(jìn)行再包裝后的產(chǎn)物)，譬如，英語“ENTER” (進(jìn)入)這個(gè)概念就具有如圖4像形式。[11]

　　由上圖看來，英語“ENTER”(進(jìn)入)這個(gè)概念就可以被分析為數(shù)個(gè)意象圖式在時(shí)間序列中的組合，包括“物體”(object)“源點(diǎn)-路徑目標(biāo)”(source-path-goal)與“容器-容納物” (container-content)。很顯然，無論我們所討論的智能體具有怎樣的傳感器與運(yùn)動(dòng)設(shè)備(譬如，無論它是像蝙蝠那樣通過回聲定位系統(tǒng)來辨別方位，還是像鴿子那樣通過磁力線來辨別方位)，它們都具有上述關(guān)于“ENTER”(進(jìn)入)的認(rèn)知圖式。換言之，即使他們彼此之間的感官道不同，它們也都能夠在NLP的層面上理解 “ENTER”(進(jìn)入)這個(gè)概念。

　　由此我們不難推出：對于 NLP 的研究來說，我們需要做的是：(甲)列出一系列類似 “ENTER”(進(jìn)入)的與時(shí)空感密切相關(guān)的概念;(乙)對這些概念進(jìn)行“圖式化”;(丙)對這些圖式化的結(jié)果進(jìn)行算法化處理。平心而論，筆者認(rèn)為在這三個(gè)步驟中，最難處理的是(丙)，因?yàn)槟壳笆澜缟仙星覜]有出現(xiàn)比較成熟的針對認(rèn)知語言學(xué)的“圖式”概念的算法化方案[12(某] 些奠定的處理方案是基于神經(jīng)元網(wǎng)絡(luò)模型對圖式加以刻畫的，但是筆者對相關(guān)路徑的可靠性有所懷疑。因?yàn)槠拗疲疚膶⒉粚ο嚓P(guān)理由進(jìn)行展開)。但筆者堅(jiān)持認(rèn)為，由“圖型論”所代表的康德式調(diào)和路線，乃是解決NLP 系統(tǒng)之“具身化”問題的必經(jīng)之路，否則，我們便既無法擺脫極端的唯理論思路所帶來的困擾(此困擾即：抽象的符號如何在物理世界中獲得意義奠基?)，也無法擺脫極端經(jīng)驗(yàn)論所帶來的困擾(此困擾即：具有不同感官道的智能體之間的交流，是如何可能性的?)。換言之，沿著這一中間道路繼續(xù)進(jìn)行優(yōu)化，乃是研究NLP體系之具身化的恰當(dāng)限度的題中應(yīng)有之義，因?yàn)閺恼軐W(xué)角度上看，走別的路徑，我們或許就根本沒有成功的可能。

　　總結(jié)

　　從本“導(dǎo)論”完成的討論來看，NLP問題的研究的確對整個(gè)AI的研究來說具有指標(biāo)性的意義。但對于該問題的哲學(xué)面相的了解，卻一直沒有被 NLP 學(xué)界所充分地意識到。毋寧說，目前 NLP 學(xué)界研究的話題取向是完全被偶然的工程學(xué)需求或商業(yè)需求所牽導(dǎo)的，而缺乏哲學(xué)(甚至是科學(xué))層面上的整體謀劃。更有甚者，在筆者所了解的范圍內(nèi)，語言哲學(xué)界目前也缺乏全面介入NLP研究的充分理論沖動(dòng)。這種“兩張皮互不相擾”的狀態(tài)顯然是不能讓人滿意的。此外，同樣令人感到擔(dān)憂的是，隨著國際科技競爭與交流環(huán)境的改變，國內(nèi)很多與 AI相關(guān)的投資方向都被集中到了精密芯片的制造行業(yè)，與之同時(shí)，投向貌似更“虛”的AI架構(gòu)研究的注意力卻明顯不足。殊不知工程師們對于高性能芯片算力的無休止的索求，在哲學(xué)層面上就已經(jīng)預(yù)設(shè)了優(yōu)秀的NLP機(jī)制與其它AI 機(jī)制的運(yùn)作乃是基于大數(shù)據(jù)的(因?yàn)橹挥泻Ａ康臄?shù)據(jù)才會(huì)倒逼人們?nèi)ふ揖薮蟮乃懔εc之匹配)。然而，在前文的分析中我們已經(jīng)看到了，這一預(yù)設(shè)本身可能就是錯(cuò)誤的，因?yàn)檎Z言機(jī)制運(yùn)作之本質(zhì)，便是通過對于少量核心規(guī)則與核心詞匯的掌握而具備創(chuàng)生出海量的表達(dá)式的潛能——而并非是通過對于海量的現(xiàn)成的表達(dá)式的構(gòu)建方式的模仿，建立出一個(gè)又一個(gè)“特設(shè)” (ad hoc)的語言模型，最終陷入“以有涯追無涯” 的困境。從這個(gè)角度看，目前全球的NLP研究也好，整個(gè)AI工業(yè)也罷，都尚且處在“盲人摸象” 的階段，而尚且遠(yuǎn)遠(yuǎn)沒有資格戴上“成熟科學(xué)” 的王冠。

上一篇：基于HTML5與CSS3的網(wǎng)頁設(shè)計(jì)技術(shù)研究

下一篇：多策略協(xié)同改進(jìn)的阿基米德優(yōu)化算法及其應(yīng)用

相關(guān)論文推薦

熱度：129℃新媒體宣傳在企業(yè)管理中的重要性
熱度：326℃大數(shù)據(jù)時(shí)代下計(jì)算機(jī)信息處理技術(shù)
熱度：107℃DES算法實(shí)現(xiàn)過程期刊論文發(fā)表
熱度：104℃計(jì)算機(jī)病毒預(yù)防中“云安全”的應(yīng)
熱度：121℃結(jié)合注意力機(jī)制和特征融合的靜態(tài)
熱度：155℃淺談基于RRAS與虛擬專用網(wǎng)技術(shù)在
熱度：190℃網(wǎng)絡(luò)工程師論文云計(jì)算技術(shù)在民用
熱度：466℃計(jì)算機(jī)技術(shù)在廣播電視發(fā)射監(jiān)控中
熱度：74℃樹人論文刊發(fā)網(wǎng)絡(luò)布線中的問題
熱度：93℃計(jì)算機(jī)技術(shù)在檔案信息化管理中的

論文指導(dǎo) >

SCI期刊推薦 >

論文常見問題 >

SCI常見問題 >

日韩欧美视频一区-日韩欧美三区-日韩欧美群交P内射捆绑-日韩欧美精品有码在线播放免费-成人免费一区二区无码视频-成人免费一级毛片在线播放视频

人工智能如何“說人話”？ ——對于自然語言處理研究的哲學(xué)反思