本書把所構想的語言機器作為語言媒介系統工具的最新發展,語言機器也可以放在計算機器的歷史中來進行分析與比較。
圖靈在構想圖靈機時,是從觀察人用筆在紙上進行計算的過程開始的,所構想的圖靈機裝置就是用來模擬人類計算過程中的行為。圖靈機通過建立符號,內部狀態,以及輸入與狀態如何決定輸出的規則來對計算問題建模。簡單地說,給出輸入,圖靈機就能有規則地輸出。圖靈機的思想更多是從機器出發的,這體現於圖靈機的原子操作都是基於一個字元進行的:讀入一個字元,進行判斷處理,輸出也只是一個字元或無輸出。這從人的視角來理解並不自然。人工計算操作時關注物件是各種表示式,只在特定的情形下,才可能是單個的符號。在本書中,我們把計算看作是表示式上的等價-替換作為計算操作。在抽象的意義上,圖靈機從輸入到規則的輸出也可看作是一種替換操作。只是單個符號上的替換並不是人類計算行為模式。帶來的效果是同樣的問題通常圖靈機需要建立更多的規則。
前面講過,圖靈機與喬姆斯基的2型文法等價。喬姆斯基文法理論的基礎,如產生式規則,性質上也是一種替換操作。喬姆斯基的文法理論構成了現代程式設計語言的語法基礎。在圖靈提交其論文幾個月前,美國數學家阿隆佐·邱奇(Alonzo Church:1903.6–1995.8)提交了論文「關於判定性問題的解釋」,同樣證明了判定性問題無解。邱奇的論證基於Lambda演算。邱奇的Lambda演算與圖靈機的計算能力等價。考察Lambda演算理論,可以發現演算所進行的操作,明顯地體現為遞迴的符號替換。對計算機器歷史進行更多考察,可發現其它基於類似替換操作設計的計算機器模型。圖靈機思想裡沒有說明從輸入到輸出的規則從那裡來,這看作是開放的。邱奇Lambda演算理論、喬姆斯基文法理論及其他的理論與模型,也都是從特定技術角度來考慮替換的。本書裡並不把計算作為一個獨立的主題來研究,而是把計算放在符號使用的背景下來研究,計算所依據的替換規則可歸為知識或事實裡的等價關係,包括現有的等價關係,以及潛在可推匯出的等價關係。本書所基於的背景,使得機器可以作為語言媒介系統的工具。
現代計算機是圖靈機的一種工程實現,圖靈機並不是只能以現代計算機這樣的方式實現。現代計算機的處理最終都分解回算術、邏輯的計算,圖靈機理論本身沒有這樣的要求,這只是技術路線決定的。二進位制及其計算在符號與物理上的一致性帶來了現代的計算機。在語言機器構想中,從計算執行的效率來說,基於替換-轉換的過程可以具有特別的優勢。因為這可以在任何層次的表示式上直接進行操作,減少了分解回到原子操作的過程。表示式上的一次替換-轉換操作對應的是多次現代計算機的原子級的算術、邏輯計算操作及相應的內部通訊,理論上空間與時間的消耗都會更小。
利用現在的計算機,虛擬出在表示式層次進行替換-轉換操作的能力是可能的,或者封裝出基於替換-轉換操作的程式設計語言也是可能的。對語言機器的目標來說,這些方案只具有有限的驗證意義。首先這帶來了某種迴圈:基於邏輯、算術的計算去虛擬替換-轉換操作,基於替換-轉換操作又去構造邏輯、數學上的計算。概念上,本書認為替換-轉換是比邏輯、算術計算更為基礎的操作。其次,這犧牲了語言機器可能具有的效率優勢。語言機器的構想,其設計與實現可能借鑑當前計算機的一些技術,整體的使用模式上很難去與馮·諾依曼型機器的使用類比。可以預計語言機器得以實現,它的能力也不會超過一臺通用圖靈機,這也不構成對語言機器的關鍵評價,語言機器所追求的是新的人機協同所能帶來的效果,這些效果首先對人而言的。
如果語言機器最終是可實現的,這種機器是專用的,還是可以作為新的通用機器?現在去考慮這樣的問題顯得太早。可以看到,到目前本書的討論基本是限定在理論性知識的範圍,相比較,現在計算機的應用主要是在技術、工程性的領域。在這些領域的問題處理中,很多的問題並不是典型的計算問題;各類的問題的求解,經驗性規則同樣重要,它們不都是從理論可推匯出的。本書是將語言機器放在語言工具的視角下來理解,支撐人對符號的使用始終是第一位。另一方面,機器一旦表現出某些潛力,人們就會去讓機器的潛力得到最大的發揮,這種努力更容易進行,並可能對機器面向人的符號使用的目標產生反作用。
應用上,語言機器在語言機制與內容上的深入,與當前人工智慧所考慮的問題相關,從而二者也可以去比較。根本上,它們思想上的出發點是不一樣的。語言機器的首要目標是替換紙張、筆、墨水、計算機之類的工具來支撐人類的語言構建與使用,實現工具輔助下更有效的人類語言使用。當代的人工智慧總的來說是用機器來模擬人腦的智力行為,從而更多原來由人完成的工作可以由機器替代。本書把人類的智力看作隨符號使用而發揮或擴充套件的,而不是一個大致固定的模式可以用機器去模仿並替代。
在更好地配合人類使用符號的同時,人所具備的知識,機器可以以越來越相近的方式具備,且機器所具備的知識可以超出任何人類個體的容量;以前由人進行的符號規則性操作,越來越多可由機器執行,並且更具效率;此時,說機器表現出的行為具有智慧的性質也沒什麼問題。我們來看一個具體的例子,類別與範例的關係。A是一個類別,x為類別下的一個範例,我們說x歸屬A,「歸屬」這個詞可以通過解釋為人理解。這種解釋形成的理解是否真正有效是存疑的,我們也不可能對機器進行這樣的解釋。現在,可以實現這樣的機制:x是類別A下的一個範例,包含A的任何命題,可以用x來替換其中的A,命題仍然成立。這種可替代的關係在特定語境中可由機器實際執行,從操作的意義上,語言機器表現出已理解了「x是類別A下的一個範例」。機器不會象人一樣去理解符號單位有沒有意義,具體有什麼意義;另一方面,理解的一個重要標誌是知道如何去操作符號。
一種流行的觀點認為現代計算機較擅長處理結構化規則性知識,而對非結構化開放性的知識,如常識一類的知識,機器處理能力一般; 機器在後一方向上進展,可以更多理解與模仿出人類的智慧。首先,本書不認為已建立了對結構化規則性知識的完善理解,並將這一理解體現在機器應用上。現代計算機是從將計算作為一個獨立的主題開始的。為此,本書建立了自己的理論,核心的觀點是:知識基於等價關係表示,計算依據等價關係進行。在此基礎上,我們論述了知識如何在機器裡建立,從而也使機器具備推演能力。重要的是那些結構化規則性的知識,對應著符號對人類智慧與認知的擴充套件,從機器與人類分工的角度,改善或創新工具來增強這種擴充套件是一種合理的做法。
對常識的重視使自然語言也成為當前人工智慧的一個核心主題。通過建立複雜的語言模型,在大量語料上進行統計計算,機器也表現出一定的語言處理能力。從經濟角度,這些進展可以具有巨大的價值,絕大多數的白領工作都是一些固定模式的工作,並不需要真正的創造性。這些處理接近了人類智力的某些部分,這是有可能的,但這不會是核心的部分。語言機器所具有的推演能力,理想的情況下是從當前已知的理論與事實,可以計算出所有可能的結論,這種能力是人類藉助符號擴充套件的那一部分智力,本書只是重新理解並去將這一部分的智力實現為更通用的方式。
當我們建立的系統表現出可以命名、可以定義、可以去形成新的認知並表達,以及能提出問題,大概才能說接近了人類智力的核心。這可能需要更系統的研究,建立從感知經驗到符號系統,從自然語言到抽象符號系統的連續理解,才可能發現背後是否存在一些始終依賴的智力形式。本書更關心的是:能否發展新的符號形式與使用方式,使人類對符號的使用更高效。