關於大模型對未來影響的一點看法

2023-03-24 06:06:41

人們總是高估了未來一到兩年的變化,低估了未來十年的變革。
---比爾蓋茲

近來OpenAI的GPT技術可以說在全球都帶來了巨大的影響,也讓大家看到了什麼叫大力出奇跡。chatGPT和GPT4的能力給了大家很大的震撼,其流暢自如、邏輯清晰、出眾的能力,給使用過的人都留下了深刻的印象,同時也讓無數人對這項技術產生了擔憂和畏懼,其中就包含即將踏入網際網路行業的我。

起初在chatGPT剛出來的那段時間,我是抱著瞭解但未嘗試的態度的,知道這項技術很先進,但是不知道其對未來的影響,或許是因為沒有親身去使用導致了對其能力的低估吧。後來其越來越火,GPT4相繼問世,我使用之後的感受,我切身感受到了這一技術的變革性。

gpt是個什麼樣的技術呢?生成式預訓練的模型,主要用在自然語言生成上,能夠處理各種語種的輸入和輸出,如中文,英文等各種主流語言,不知道是否支援世界上所有有文字資料的語種。

目前gpt的技術主要應用在對話中,即人與計算機進行對話 --- chatGPT,能夠記憶多輪對話的內容,並結合上下文給出相應的答案,且生成的文字邏輯上,語法上都有很好的準確性。對話的內容不限,從生活常識,到百科,到文學,到各行各業的知識,學術界的,工業界的,都能給出不錯的答案。目前關於垂直領域的知識,主要是關於計算機的,不知道其他工科的怎麼樣。但也並不是毫無缺點,生成的文字可能會有一些事實性錯誤,編造一些不存在的東西,不能確保準確性,有些泛泛而談。

綜合以上,可以對chatGPT做一個總結:一個擁有強大文字生成能力的模型,能夠處理各種問題,理解語言中較複雜的語意,但也存在一些缺點。

現在發展到的gpt4,不僅可以處理文字,還具有了多模態的能力,能夠理解影象,生成影象。或許以後能夠輸入輸出更加的自由,可以是文字,語音,影象,視訊等,輸出亦然。

關於未來的大模型。可以沿著發展趨勢展開一下想象,在未來的某天:大模型技術取得了更大的進步,其理解人類世界的能力愈發強大,不僅能夠以顯而易見的方式接收資訊,如視、聽,或許還能觸控,再加上對現實的理解,AI能做到的事或許和人類沒有很大差距,甚至能夠在某些方面(很多方面)超越人類。在工作中,你大部分時間在與AI系統打交道,你的上下游是AI系統,你接受AI的任務,解決一些AI暫時不能解決的問題後交給下游的AI來完成;生活中,可能有一個能力超強、且很懂你的AI助手、管家、甚至伴侶,管家能夠接管你生活中的絕大部分安排,為你指定各種計劃,替你規劃、決策,為你的孩子輔導功課;商店裡、飯店裡,與你交流的可能是服務員。

要實現這樣的未來,我們還有多遠的,什麼樣的了路要走呢?

作為一名即將進入網際網路行業的學生來說,AI的發展確實讓我對自己的職業發展著實擔憂了一把。未來AI技術的強大,一些方面的工作會很快被AI技術取代,目前已知的發展空間會被壓縮,進而影響自己的工作待遇、職業發展方向。畢竟,未來的變動需要我們花費時間、精力去學習、去適應,還參雜很多不確定性。如果這真的是一場革命,那麼肯定會有現在所不知的機會和機遇出現。幹好當下的事很重要,但我現在能為未來做什麼呢?接下來分析一下發模型對未來的行業的影響。

資料隱私一定是一個首要考慮的因素,因此很多商業化場景中會以安全,隱私為重要的考慮,可能會導致很多公司構建自己的大模型,不一定要達到最優的水平,但能在自己的垂直場景中達到一定的壁壘。各個公司如何構建自己的大模型呢?沒有這個能力怎麼辦?雖然現在很多巨頭都在往這個方向發展,但是真正做的好,能商業化的並沒有那麼多,市場還是一片藍海。可以想到,這麼多的巨頭尚不能做的很好,其他的行業、公司有怎麼做呢?當然,以後會有更多的公司能夠做好,但是還是存在一個分水嶺,嶺以上的公司有能力做好自己的大模型,以下的公司不會自研或者說會另闢蹊徑。有能力的公司可以把自己的大模型以服務的形式向外提供,並以此開展自己的產品。

在大模型掀起的這場革命(如果有)中,未來的軟體會是什麼樣子的呢?現在的軟體開發過程,通常需要人來溝通和理解需求,開發完成後進行迭代修改,並進行維護。如果AI能快速、準確地實現需求,或者小的需求塊,那我們可能主要負責對需求的劃分、細化、整理使其標準化(AI能理解的形式),具體的開發將由AI自動完成,最後再加以測試和人工檢查和測試。這個時候可能很多低階(簡單,容易被流程化)的開發會被取締,程式設計師的工作重點更多放在整體流程的把控和分解上。那個時候,或許我們能開發出更大規模的軟體,以更快的速度,類似於流浪地球2中MOSS自動生成作業系統。這個時候的程式設計師還需要具備手撕程式碼的能力嗎?整體架構、流程的把控和理解或許是更為重要的能力,對技術的廣度有更高的要求。

當然,並不是所有地方都會上大模型,但是很可能大家都會使用它。一種方式是對大模型的小型化,或者使小模型同樣擁有足夠的能力,一種是API的形式,把大模型作為一項服務,在有一種可能是二者的結合,在共有大模型的基礎上產品有自己的私有模型。大模型的小型化,這也是業界和學界一直在做的事情,模型的量化、壓縮、剪枝、蒸餾等,以及在各種硬體平臺上適配。API的形式就不贅述了。我覺得目前還未出現,但是將來很有可能出現的就是第三種情況:共用大模型+私有模型。同樣是處於對資料安全性考慮,也是維護自身產品壁壘。依賴大模型構建的產品,資料是其靈魂,也是其壁壘所在,也包括安全問題。如何在這樣的約束下用好大模型?個人的一個想法:對大模型的拆解、分析,大模型的擴充套件能力,大模型與小模型(私有模型很有可能就是小模型)的融合,最好能夠做到大模型是一個大軟體,小模型則是一個外掛,能夠很好的藉助大模型的能力。

最令我期待的是具身智慧 --- 我們接觸的是具有實體的AI。當前AI技術在很多領域都有了很大的發展,CV、NLP、語音等,但更多的是以工具的形式出現在我們的生活中。但這些技術很多終究是沒能達到流程與人類進行互動的能力,但現在我們看到希望了,GPT正在逐步實現(已經?)這一點。以上技術的融合是很有可能出現一個能夠數位人的,能夠具身,就看未來硬體和機器人技術的發展了。

希望未來不需要擔心以上問題。

再放幾張《Bicentennial Man》的劇照,希望我以後也能有機器管家(當然不是安德魯那樣的