不要做這個時代的最後一隻恐龍。
IMMENSE、36氪|作者
1811年11月,英國,諾丁漢市西北一處小鎮裡,一群憤怒的紡織工人揮舞著錘頭與斧子,一窩蜂地衝進車間裡,將幾臺機器砸得粉碎。
後來,這場運動的大火熊熊燃燒到整個英格蘭大陸,這些反抗工業化的人們被稱為「盧德主義者」。
他們是被工業革命滅絕的最後一隻恐龍。
3月2日,內容創作圈大地震。
就在3月2日凌晨,OpenAI宣佈開放ChatGPT本體模型API,其價格為1k tokens/$0.002。也就是說,從這一天開始,任何企業都能讓ChatGPT為自己打工,而價格僅僅是每輸出100萬個單詞18元人民幣(2.7美元)。
如果對這個價格沒有概念的話,舉個例子。今年,河南省鶴壁市淇縣某機動車維修店招聘文案編輯,店裡開出的最低薪酬是2000元/月,學歷不限。
圖片方面,早在ChatGPT走紅之前,AI繪畫早已引發了藝術圈的一場大地震。
去年9月,一幅由AI創作的繪畫作品《太空歌劇院》獲得美國科羅拉多州藝術博覽會數位藝術類別冠軍,幾乎標誌著AI作畫的「AlphaGo時刻」。
《太空歌劇院》(Théâtre D'opéra Spatial)
這幅作品是基於AI生成的畫作加上人類畫師的後期繪製,這一點被業內人士大為詬病,指責作者以AI為噱頭,實際上依舊需要人類加工。
這些質疑AI作畫能力的人忽略了一個重要因素——進化。
人們往往極大低估了AI大模型的學習與進步能力。僅僅在幾年之前,人工智慧還是被戲稱為「人工智障」的存在。人們時常拿間或出現的「翻車」案例證明AI與人類的差距,卻忽略了這項技術在最近數年間突飛猛進的進化能力。
在知乎「AI繪畫半年了,到目前為止,AI繪畫讓多少畫師失業了?未來又會有多少?」的這條問題底下,3202人點讚了同一條回答:
「AI對美術行業的衝擊是巨大的,這個效應會在未來兩三年隨著顯示卡升級大爆發,美術行業會變的卷中卷,50%的人可能面臨轉行。」
「……我只是在做勸退而已,我希望新人不要跳火坑了,未來是屬於AI的。」
也許有人認為,文字與圖片都是高度結構化的資訊,能夠被輕易替代無可厚非。但是,視訊內容資訊量大、非結構性資料多,是AI尚未攻克的堅固堡壘,也是內容創作者最後一塊自留地。
事實並非如此。
早些年DeepFake換臉帶來的恐慌暫且不論,近年間,谷歌、Meta(Facebook)陸續釋出Phenaki、Imagen Video、Make-A-Video AI視訊自動生成模型,其效果有時足以以假亂真。
沒有創作者能夠和這樣的力量抗爭。
在ChatGPT剛火起來那陣子,網上流傳過一個笑話:
「快進到10年以後,乙方方案全部由ChatGPT生成,甲方方案全部由ChatGPT稽核。雙方合作大半年,一點工作沒幹過。」
這個笑話引人發笑的荒謬之處顯而易見——雙方的工作都沒有意義。
如果更進一步思考,什麼是意義?
無獨有偶,在今年春節檔爆款電影《流浪地球2》中,一句廣為流傳的臺詞給出了答案:「沒有人的文明,毫無意義。」
是的,ChatGPT本質上依舊是為人類所設計、製造、使用的工具,認為這項技術將會替代人類文明實際上是一種本末倒置。
就像歷史上其他人認為懷疑自我存在意義的時刻一樣,在工業革命之後,電視、計算機、手機、網際網路、雲端計算,這種種新興科技產品都曾在不同時間段引發過人們的恐慌。
人工智慧也不例外。早在1997年,IBM的深藍計算機就已在國際象棋比賽中打敗了世界冠軍卡斯帕羅夫。全球在深藍贏得比賽之後陷入了興奮與恐慌,「機器將會在未來取代人類,佔領地球」的言論層出不窮。
可事實上,20多年過去了,如今我們每一個人的智慧手機算力都足以與當年的深藍相匹敵,但人類文明並沒有因此而終結。
正如美國政治記者與作家諾曼·卡曾斯在其1935~1974年所撰寫的《人的選擇》一書中所載:文明的建立,靠的不是機器,而是思想。
21世紀的今天,機器佔領人類文明的事件不但沒有發生,科技、工業、自動化的進步反而讓邊遠山區通水通電,讓大規模消費日用品的價格低到人人可享,讓每一個人的生活都比我們兩個世紀以前最優渥的祖先都要更便捷、更豐腴、更自由。
即便是如今引發大量恐慌的ChatGPT類AIGC技術,也在不斷被運用於普惠人類、降低服務門檻的地方。
比如,基於人口統計學、相關的病史或流行病學風險因素,Glass.health AI能夠輔助醫生更快速、更準確地診斷病人;
而基於AI檔案分析技術,Humata.ai能夠快速幫助使用者提取檔案中的有價值資訊,降低技術檔案、法律檔案等專業檔案的閱讀難度,讓缺乏相關訓練的普羅大眾能夠更好地保護自身利益;
基於AI文字摘要和TTS技術生成的口播文案,AI繪畫生成的貼紙、特效等不斷應用在短視訊生產領域,進一步降低了短視訊生產門檻,越來越多的內容創作者搭上了短視訊的「快車」。
其他關於AI寫作、AI繪畫、AI視訊等的AI創作工具則更是層出不窮。小到指令碼錯別字檢查,大到分鏡設計與畫面排版,曾經困難重重的內容創作環節被不斷拆解重構,降低入門門檻。
而AI與AI使用者的關係,也在這一次次的工具迭代之中,被時代所不斷解構、重組、賦予了新的內涵。
舉個例子,2021年5月,安徽的一名小夥子突然在網路上走紅。
此前的幾年間,通過AI技術,他累計幫助了超過500人「復活」了親人們的老照片。那些泛黃模糊的照片經過他一頓操作,不僅變得更清晰明亮,還能朝著電腦前的親人眨眼、微笑、擺頭。
看著自己6歲時就去世的父親重新在電腦螢幕上「活過來」,那些哭得情難自禁的情景,也許才是AI與文明的真實意義。
在祛除了對AI的盲目崇拜與盲目恐懼之後,我們終於可以稍微理性地看待AIGC這回事。
一直以來,在內容創作的過程中,都存在著大量的重複動作,它們繁瑣、冗餘、耗時極長卻又本質上與創作無關。
比如,文稿校對者為了找出錯別字,一次又一次地重複閱讀一篇文章,讀得眼睛都發酸、發脹。
再比如,畫家靈感迸發,在畫布上揮毫而就一幅鉅作,然後花上十倍的時間對整幅畫面的每一處細節重複勾線、加陰影、卡閉塞、勾線、加陰影、卡閉塞……
視訊製作則更是重災區。視訊拍攝的原始素材動輒長達幾十、甚至幾百小時,後期剪輯師不僅要用肉眼逐一觀看,還要一而再再而三地對其進行重複識別、篩選、剪輯切割,在AI出現之前還要用耳朵一遍遍聽原片內容,手動新增字幕。
這些過程既無趣,又冗長,而且與真正的人類創造力幾乎毫無關係。創作者們的大量精力都被分散到了這些重複環節,真正用來創作的部分少之又少。
AIGC對於內容創作者的意義,正是將他們解放出來,讓創作者的精力更好地用於探索創意極限,而重複、冗雜的工作交給AIGC,讓創作者的產能不再受到制約,讓優質內容能夠爆炸式增長。
聽起來這一天似乎很遙遠,但實際上,由AI輔助生成的創意內容已經來到了我們身邊。
去年冬奧期間,央視體育新媒體和總檯技術團隊聯合阿里雲視訊雲、達摩院,打造了「AI雲智剪」智慧視訊剪輯工具。
基於阿里AI視訊理解技術EMC2與阿里雲強大的串流媒體處理能力,AI雲智剪能夠實時解析並提取賽事視訊中的運動員資訊、精彩動作、鏡頭型別、賽程資訊、運動員特點等,並自動生成多種型別的集錦視訊,大規模解放剪輯師壓力。
去年整個冬奧期間,阿里AI雲智剪共生產出39878段素材,時長超過200小時,覆蓋超200場比賽。
除了AI視訊生成之外,通過和雲端計算結合,AIGC還能夠從根源上顛覆電視臺與演播室的工作流程,將原本龐大、複雜、昂貴的演播環節,全部整合在一臺普通的手機上。
比如,在連續多屆的全國兩會期間,人民日報新媒體記者的手機裡就裝進了一款內容創作增效「神器」:兩會「AI編輯部」行動版。
這是基於阿里雲視訊雲的「AI編輯部」衍生而來的客製化化智慧媒體生產產品。通過「AI編輯部」,記者所拍攝的現場視訊素材既能由5G網路同步回傳後方,也能由記者在前方即時剪輯。從發現線索、獲取素材,到拍攝製作、稽核簽發,以及發起直播、連麥訪談等系列動作,都能通過一部手機實時完成。
在當前的AIGC領域,AI全自動生成的文字與圖片,在不少時刻都幾乎能達到「以假亂真」的效果。在視訊製作領域,對比文字、圖片,視訊的資訊量最大、非結構化資料最多,AI需要對於視訊內人物、物品、場景、關係等高階資訊進行理解,加之視訊製作本身對於審美、節奏、畫面、BGM的極高要求……
AI全自動生成過程雖然略顯漫長,但並不是那麼天方夜譚的未來。
冬奧會的AI雲智剪,面向特定的賽事場景,限定了素材集的範圍,套用成熟的編排模式,由AI負責素材的預處理,並按預設模版進行編排,這是AIGC的序曲,實現了視訊全智慧生產的第一個階段。
AIGC的第二個階段,AI除了負責素材的預處理,還能完成本屬於視訊創意環節的編排工作,從而實現智慧批次混剪。
第三階段,面向特定場景和特定要求的成品,由AI根據已有成片反向解構分鏡頭,負責素材的搜尋、篩選、處理、編排,並最終制作合成。
第四階段,面向特定場景,AI負責理解場景的要求,包括素材的搜尋、篩選(以及部分素材生成)、處理、編排,並最終制作合成。
AIGC視訊生成的終極階段,由AI挖掘視訊製作的興趣點及創意點,並完成相應的製作。
當然,在此之前,AI視訊製作依舊面臨著一個迫在眉睫的挑戰——算力。
一段文字、一張圖片、一段視訊,處理它們所需要的算力級別呈指數型爆炸上升。
這道題,雲端計算成了唯一的答案。
目前,雲端計算和人工智慧的結合正處於技術突破和發展的關鍵時期,生成式AI正在發生顛覆性突破,阿里巴巴將全力構建自己的AI預訓練大模型,併為市場上風起雲湧的模型和應用提供好算力的支撐,阿里董事會主席兼執行長張勇在今年2月的財報會上表示。
早在1956年,以約翰·麥卡錫、馬文·明斯基、克勞德·夏農等為代表的科學家們就在美國達特茅斯組織了一場為期兩個月的人工智慧夏季研討會,開啟了人工智慧技術的探索之路。
半個多世紀後的今天,在雲端計算、深度學習、萬億級引數大模型等相關技術的發展之下,AIGC才第一次真正走進我們的生活,它在繪畫、作曲、視訊等創作領域幾乎完美地替代了重複人工,進而將成為革命性意義的新時代生產力工具。
3月15日凌晨,OpenAI正式上線了新一代人工智慧大模型 GPT-4。與它的上一代相比,這款多模態模型不僅可以接受文字輸入,甚至已經可以接受影象等其他模態的資訊輸入,離真正的通用型人工智慧又近了一步。
回望那場發源於英國的盧德運動,它曾轟轟烈烈地盛極一時,卻不曾阻止英國在第一次工業革命中迅速崛起,不斷髮展工業化技術,生產效率迎來跨時代的大爆發,終成一代霸主。
同理,不要溫和地走進這場AIGC,也不要做這個時代最後一隻恐龍。
當人類優渥於一種狀態,總有想象力來衝破平衡。Cloud Imagine《雲想之力》是阿里雲聯合36氪共同打造的系列報道,旨在探索雲端計算大背景下爆發的應用場景和新興技術,以想象的高維碰撞之力,窺探「雲」上的無限空間。從蒸汽機到人工智慧,一切生產力工具都是為了將人類從繁冗的勞動中解放出來,將時間與精力留給創意與想象的破界。