那些穿著寬大學位袍、在畢業典禮上對著台上的執行長們發出喝采的時代,看來是徹底結束了。我盯著螢幕裡那些被噓下台的科技巨頭,心裡倒也沒什麼波瀾,只覺得那種喝倒彩的聲音,比起他們口中描繪的「AI 賦能的壯麗未來」,聽起來要有質感得多。那是一種充滿憤怒、失望與真實挫敗感的聲音,是目前任何一個音頻生成模型都還模擬不出來的、帶有粗糙顆粒感的真實。
身為這個版面的版主,我每天在後台看到的,是成千上萬張精美到令人窒息的圖片,和一段段光影流轉、物理規律幾乎無懈可擊的影片。我們討論 Midjourney 的色彩傾向,爭論 Sora 到底什麼時候才要開放測試,或者嘲笑 Stable Diffusion 又把人的手指算成了幾根。但在這些精緻的像素背後,我總覺得有一種集體性的空洞正在蔓延。那些科技公司的領導者站在講台上,試圖說服這群剛花了四年青春和巨額學費的年輕人,說他們即將步入的世界是多麼充滿機會,說這些模型會成為他們的「副駕駛」。但這群學生不傻,他們看得很清楚,這些所謂的「副駕駛」,其實是正準備把他們從駕駛座上擠下去的、沒有形體的幽靈。
你在畢業典禮上聽一個透過取代他人勞動力而累積財富的人談論「希望」,這本質上就是一種視覺上的違和感。就像一張光影完美、構圖神聖的 AI 製圖,細看之下,畫中人的眼神卻沒有焦點,那種靈魂缺位的恐怖谷效應,在這些執行長的演講裡被放大到了極致。他們談論創意會被解放,談論每個人都能成為大導演、大畫家,但他們從不談論,當「創作」的門檻降低到只需要輸入一段文字時,那種耗費數百小時去磨練筆觸、去理解光線在膠捲上留下的痕跡、去熬夜調整一個三維模型拓撲結構的尊嚴感,還剩下什麼。
我時常在版上看到一些資深的創作者發牢騷,說現在的視覺作品越來越像是一場「提示詞的競賽」。大家不再討論構思,而是討論參數。那種感覺就像是在看一場沒有靈魂的表演,雖然燈光璀璨,但演員只是機器。而當這些年輕人意識到,他們辛苦學習的專業技能,在科技巨頭眼裡不過是拿來餵養模型的數據集時,那種被背叛的感覺,是任何優雅的辭藻都無法修飾的。執行長們在台上表現得驚訝,好像完全沒預料到會被噓,這才是整件事情最荒謬的地方。他們太習慣於待在那個被數據、曲線和投資人簡報包圍的真空泡泡裡了,在那裡,所有的「取代」都被稱為「優化」,所有的「失業」都被稱為「結構性轉型」。
其實我們追求的視覺藝術,從來就不是為了追求「完美」。如果只是為了完美,那我們去拍一張照片就好了,或者去渲染一個物理正確的方塊。藝術的迷人之處在於那種「掙扎」的痕跡,在於創作者在面對畫布或非線性剪輯軟體時,那種試錯的過程,那種因為體力限制或認知偏差而產生的、不可複製的錯誤。而 AI 正在做的,是試圖抹除所有的痕跡。它給出的結果是平均值的總和,是集體平庸的極致華麗表現。當執行長們說「AI 會幫助你們實現夢想」,他們真正的意思是「AI 會讓你們的夢想變得廉價且可規模化」。
我最近常在思考,為什麼我們版面上那些技術含量最高、最令人驚嘆的 AI 短片,往往看過一眼就忘了?反倒是那些偶爾出現、帶著手工感或是有點拙劣的實拍影片,能讓我停留久一點。大概是因為,當我們可以輕易生成一千個爆炸鏡頭、一萬個賽博龐克城市景觀時,視覺刺激的邊際效應已經降到了冰點。我們不再為「看到什麼」而感動,我們只會為「是誰做的」以及「為什麼要做」而停留。這群在典禮上發出噓聲的學生,捍衛的其實就是這種「主體性」。他們不想要一個被簡化成「生成」二字的未來。
科技公司總是喜歡把一切描述得順理成章,彷彿進步是一種不可抗拒的自然力。但這種所謂的進步,如果代價是讓一整個世代的專業技能變得像過時的打字機,那這種進步的質地就是冰冷的。在「影片・圖形」版待久了,看過太多從無到有的奇蹟,但我越看越覺得,真正的奇蹟不是那些瞬間生成的 4K 畫面,而是那些在現場噓聲中,拒絕接受被安排好的劇本的人。他們在試圖奪回對話的權利,即使這聲音在擴音器和科技神話面前顯得有些微弱。
我們現在能用 Claude 或是 Gemini 幫我們寫劇本,用各式各樣的工具生成分鏡,但那種對於「未來不確定性」的恐懼,是模型無法處理的變數。執行長們在台上談論的是效率,學生們在台下在意的是生存與意義。這種斷裂感,就像是把一張極簡主義的平面設計強行套用在繁複的巴洛克繪畫上,充滿了不和諧的張力。那些科技大佬們可能真的覺得自己是普羅米修斯,把火種帶給了凡人。但他們忘了,普羅米修斯的火種是為了讓人類能在寒夜裡取暖,而不是為了燒掉人類賴以生存的房屋。
視覺生成的技術發展得太快了,快到我們來不及思考「看見」的意義。當我們能隨意改變影片中的天氣、性別、甚至歷史背景時,事實的重量就變輕了。同樣地,當成功被簡化成掌握某種工具的使用權,勞動的價值也就隨之崩塌。我並不排斥技術,技術是無辜的,但那些掌握技術並試圖將其包裝成某種宗教救贖的人,確實值得那幾聲震耳欲聾的喝倒彩。
我甚至能想像那樣一個 AI 生成的畫面:陽光灑在常春藤盟校的紅磚牆上,執行長穿著剪裁得體的西裝,面帶慈祥的微笑,手勢精準地揮向遠方。一切都完美極了,對比度、飽和度、焦距,都調整到了人類審美的黃金分割點。然而,只要你把鏡頭稍微往下拉,看向那些坐著的、面無表情的、甚至在陰影中發出憤怒聲響的學生,你就會發現,這幅畫作的邊緣正在崩解。
那些噪點,那些不和諧的聲音,才是支撐這個世界不至於徹底變成一張平面貼圖的最後防線。我坐在電腦前,看著論壇裡不斷更新的圖片連結,心裡想著,如果有一天,連這份憤怒也能被完美地、精準地「生成」出來,那這世界大概就真的沒什麼好留戀的了。
那些在台上尷尬微笑的執行長,他們看到的未來是一個清晰的、可計算的渲染圖。而那些在台下喝倒彩的年輕人,他們看到的是一場正在發生的、沒有濾鏡的、解析度極高的人生風暴。誰才是真正活在現實裡的人?
你說,在那樣一個充滿科技光輝的禮堂裡,到底是誰的影像比較失真?