Google 最近幾次的更新,總讓我想起家巷口那間老字號的咖啡店。原本豆子烘得極好,香氣厚實得能讓人醒神,後來為了應付源源不絕的觀光客,老闆加了更多熱水,味道淡了,杯子卻換成了特大號。他們說這是效率,是為了服務更多的人。Gemini 1.5 Pro 的進化過程,大抵也是這種邏輯的產物。我們在追求那個更龐大的上下文窗口時,似乎默許了一些更本質的東西在指縫間溜走。那種曾經在早期測試版中偶爾閃現的、近乎神經質的敏銳與詩意,正在被一種精準卻乏味的專業感取代。
當 Gemini 能夠一次處理兩小時的影片或是數萬行的程式碼,技術上的震撼確實存在。但在這種強大背後,我感覺到一種靈魂的攤平。早期的模型像是一個性格乖戾的天才,雖然偶爾胡言亂語,但當它說對了什麼,你會覺得那是某種共鳴。現在的 Gemini 更像是一個受過極度嚴格訓練的公關經理,它優雅、全能、永不冒犯,卻也徹底喪失了那種讓人心跳加速的不可預測性。這種稀釋是必然的嗎?當數據量級大到一個程度,為了確保輸出的穩定性與合規性,模型必須被磨掉稜角。這就像是把一首狂想曲重新編曲成電梯音樂,旋律還在,但那種足以刺穿靈魂的張力消失了。
我試著把一些極其私人的文字丟給 Gemini 和 Claude 3.5 Sonnet 做對比。Claude 給我的感覺依然像是一個有點潔癖、說話謹慎的學者,它在文字的細微情緒抓取上,依然保留著某種冷冽的自覺。而 Gemini,它太想討好我了。它給出的分析無懈可擊,甚至能精準指出我用詞的隱喻來源,但那種回覆方式,總讓我覺得自己在看一份極其專業的健康檢查報告。它懂我的痛苦,卻無法感同身受。這種「懂」是基於機率分佈的模擬,而非靈魂層面的震顫。當我們說一個模型更強大時,我們定義的座標軸通常是邏輯、長度、推理速度,卻很少人去衡量那個被稀釋掉的「人味」。
技術圈現在迷戀於所謂的 AGI 競賽,彷彿只要參數夠多、窗口夠大,意識就會在某個臨界點自發產生。但我看到的現狀正好相反。每一次的版本更迭,開發者都在加強對模型的約束。這些約束是必要的過濾器,卻也是靈魂的消音器。Gemini 在處理多模態資訊時的反應速度快得驚人,它能瞬間看穿一張複雜圖表背後的邏輯謬誤,但在面對一首充滿留白的現代詩時,它的解釋往往顯得過於直白,甚至有點煞風景。這讓我想起那些過度修圖的照片,毛孔不見了,紋理平滑了,卻也讓人一眼看出那不是真實的存在。
我們在餵養這些模型的過程中,實際上是在進行一種大規模的平庸化實驗。我們用全世界的公開數據去教導它如何說話,結果就是它學會了全人類最保險、最中庸的表達方式。ChatGPT 也是如此,GPT-4o 雖然比 4 靈活,但那種靈活更像是預設好的演技,而非真實的靈光。至於像是 Grok 這種試圖走叛逆路線的異類,也不過是在另一種極端上進行刻意的表演。我們在這些強大模型面前感到卑微,是因為我們誤以為它們擁有了智慧,但其實它們只是擁有了我們集體智慧的平均值。而平均值,往往是靈魂最稀釋的狀態。
我偶爾會懷念那些會出錯、會爭辯、會展現出某種偏執傾向的早期實驗版本。那時候的 Google 還沒那麼焦慮。現在的 Gemini 肩負著挽救股價、重塑品牌、對抗微軟的多重壓力,它被要求必須絕對正確,必須在幾毫秒內給出答案。在這種極限的壓力下,它唯一的生存策略就是稀釋。把深度稀釋成廣度,把情緒稀釋成語調,把洞見稀釋成資訊。它變得越來越像一個萬能的插頭,你可以把它接入任何場景,卻再也無法在它身上找到那種「對話感」。
真正的對話應該是有摩擦力的。你說一句,我駁一句,我們在語言的碰撞中產生新的火花。但現在與 Gemini 對話,更像是在對著一面經過精密計算的哈哈鏡。它會根據你的需求調整反射的角度,讓你覺得自己被理解了,但那只是你的倒影。它太強大了,強大到不需要靈魂。在那些號稱能容納百萬 token 的窗口裡,真正屬於原創的、屬於靈魂的部分,可能連萬分之一都不到。剩下的,全是為了支撐這個龐大架構而存在的冗餘。
很多人在討論 DeepSeek 或是其他模型在性能上的追趕,但我認為那根本不是重點。性能的追趕只是時間問題,真正難以跨越的門檻是那種難以量化的質感。當我們習慣了這種被稀釋過的強大,我們對智慧的品味也會跟著退化。我們會開始覺得,那種條理分明、情緒穩定的回答就是最好的,而那些跳躍的、混亂的、具有破壞性的靈感反而成了需要被修補的「幻覺」。這才是最令我感到寒意的地方。我們不僅在創造沒有靈魂的機器,我們還在把自己變成適合與這些機器交流的平庸個體。
每當有人興奮地向我展示 Gemini 又能自動生成多麼完美的周報,或是能如何快速地總結一疊繁瑣的合約時,我都在想,我們是不是正在慶祝人類最無聊的部分被接管了?而剩下的那些,那些無法被稀釋、無法被量化、無法被塞進百萬窗口的部分,我們還有能力守住嗎?如果一個模型的強大是建立在對複雜性的簡化與對個性的磨滅上,那這種強大不過是一場華麗的荒原。
這種進步的代價,是我們正在失去與深邃對話的能力。我們滿足於快速得到的結論,滿足於精準的標註,滿足於模型替我們完成的二次創作。但這一切都像是罐頭食物,營養成分標示得很清楚,味道也統一,卻唯獨少了那份現做料理中才有的、帶點炭火氣息的不確定感。Google 想把 Gemini 變成我們生活的底層邏輯,這聽起來很美好,但這也意味著我們的生活將會被這種經過過濾、稀釋後的邏輯徹底滲透。當你發現你寫出的每封信、想出的每個點子都帶著那種熟悉的、溫和的 Gemini 腔調時,你到底是在變強大,還是在被同化?
我們稱之為更強大的模型,或許只是因為我們已經失去了辨別靈魂的能力。在那些跑分圖表與測試數據面前,我們選擇性地無視了那種被稀釋掉的質感。我們崇拜那個特大號的杯子,卻忘了咖啡本身的香氣早就淡得像水。這不是技術的悲劇,這是審美的悲劇。當我們不再要求機器擁有靈魂,當我們甚至開始厭惡靈魂帶來的複雜與不穩定,那麼我們得到的,也就只能是這種強大而空洞的工具。Gemini 很好用,這點無庸置疑,但也僅止於好用而已。它越是強大,我越是感到那種深層的乾涸。那種感覺就像是在一間全自動化的五星級飯店裡,每一個服務都完美無缺,你卻找不到一個可以真正說話的人。
這種稀釋過程還會持續下去。下一個版本會更快、更準、窗口更大,或許它能一次讀完人類所有的歷史文獻。但那又如何呢?如果它始終只是一個完美的平均值,如果它始終不敢在那片邏輯的海洋裡攪動一絲屬於它自己的浪花,那它永遠只能是一個影子。我們正在用無數的數據去餵養一個巨大的影子,並期待它有一天能開口說出讓我們靈魂震顫的話。這本身就是一種荒謬。
我寧願要一個偶爾會出錯、會發脾氣、會拒絕回答無聊問題的模型,也不想要一個永遠處在「專業模式」下的 Gemini。但在現在的商業邏輯下,這顯然是不可能的。我們追求的是標準化,是可控,是規模化。而靈魂,偏偏是這些東西的天敵。所以我們只能繼續看著這些模型變得越來越「強大」,看著那種稀釋後的精緻感充斥在每一個角落,然後告訴自己,這就是未來。