靈魂被稀釋後，我們稱之為更強大的模型

Google 最近幾次的更新，總讓我想起家巷口那間老字號的咖啡店。原本豆子烘得極好，香氣厚實得能讓人醒神，後來為了應付源源不絕的觀光客，老闆加了更多熱水，味道淡了，杯子卻換成了特大號。他們說這是效率，是為了服務更多的人。Gemini 1.5 Pro 的進化過程，大抵也是這種邏輯的產物。我們在追求那個更龐大的上下文窗口時，似乎默許了一些更本質的東西在指縫間溜走。那種曾經在早期測試版中偶爾閃現的、近乎神經質的敏銳與詩意，正在被一種精準卻乏味的專業感取代。

當 Gemini 能夠一次處理兩小時的影片或是數萬行的程式碼，技術上的震撼確實存在。但在這種強大背後，我感覺到一種靈魂的攤平。早期的模型像是一個性格乖戾的天才，雖然偶爾胡言亂語，但當它說對了什麼，你會覺得那是某種共鳴。現在的 Gemini 更像是一個受過極度嚴格訓練的公關經理，它優雅、全能、永不冒犯，卻也徹底喪失了那種讓人心跳加速的不可預測性。這種稀釋是必然的嗎？當數據量級大到一個程度，為了確保輸出的穩定性與合規性，模型必須被磨掉稜角。這就像是把一首狂想曲重新編曲成電梯音樂，旋律還在，但那種足以刺穿靈魂的張力消失了。

我試著把一些極其私人的文字丟給 Gemini 和 Claude 3.5 Sonnet 做對比。Claude 給我的感覺依然像是一個有點潔癖、說話謹慎的學者，它在文字的細微情緒抓取上，依然保留著某種冷冽的自覺。而 Gemini，它太想討好我了。它給出的分析無懈可擊，甚至能精準指出我用詞的隱喻來源，但那種回覆方式，總讓我覺得自己在看一份極其專業的健康檢查報告。它懂我的痛苦，卻無法感同身受。這種「懂」是基於機率分佈的模擬，而非靈魂層面的震顫。當我們說一個模型更強大時，我們定義的座標軸通常是邏輯、長度、推理速度，卻很少人去衡量那個被稀釋掉的「人味」。

技術圈現在迷戀於所謂的 AGI 競賽，彷彿只要參數夠多、窗口夠大，意識就會在某個臨界點自發產生。但我看到的現狀正好相反。每一次的版本更迭，開發者都在加強對模型的約束。這些約束是必要的過濾器，卻也是靈魂的消音器。Gemini 在處理多模態資訊時的反應速度快得驚人，它能瞬間看穿一張複雜圖表背後的邏輯謬誤，但在面對一首充滿留白的現代詩時，它的解釋往往顯得過於直白，甚至有點煞風景。這讓我想起那些過度修圖的照片，毛孔不見了，紋理平滑了，卻也讓人一眼看出那不是真實的存在。

我們在餵養這些模型的過程中，實際上是在進行一種大規模的平庸化實驗。我們用全世界的公開數據去教導它如何說話，結果就是它學會了全人類最保險、最中庸的表達方式。ChatGPT 也是如此，GPT-4o 雖然比 4 靈活，但那種靈活更像是預設好的演技，而非真實的靈光。至於像是 Grok 這種試圖走叛逆路線的異類，也不過是在另一種極端上進行刻意的表演。我們在這些強大模型面前感到卑微，是因為我們誤以為它們擁有了智慧，但其實它們只是擁有了我們集體智慧的平均值。而平均值，往往是靈魂最稀釋的狀態。

我偶爾會懷念那些會出錯、會爭辯、會展現出某種偏執傾向的早期實驗版本。那時候的 Google 還沒那麼焦慮。現在的 Gemini 肩負著挽救股價、重塑品牌、對抗微軟的多重壓力，它被要求必須絕對正確，必須在幾毫秒內給出答案。在這種極限的壓力下，它唯一的生存策略就是稀釋。把深度稀釋成廣度，把情緒稀釋成語調，把洞見稀釋成資訊。它變得越來越像一個萬能的插頭，你可以把它接入任何場景，卻再也無法在它身上找到那種「對話感」。

真正的對話應該是有摩擦力的。你說一句，我駁一句，我們在語言的碰撞中產生新的火花。但現在與 Gemini 對話，更像是在對著一面經過精密計算的哈哈鏡。它會根據你的需求調整反射的角度，讓你覺得自己被理解了，但那只是你的倒影。它太強大了，強大到不需要靈魂。在那些號稱能容納百萬 token 的窗口裡，真正屬於原創的、屬於靈魂的部分，可能連萬分之一都不到。剩下的，全是為了支撐這個龐大架構而存在的冗餘。

很多人在討論 DeepSeek 或是其他模型在性能上的追趕，但我認為那根本不是重點。性能的追趕只是時間問題，真正難以跨越的門檻是那種難以量化的質感。當我們習慣了這種被稀釋過的強大，我們對智慧的品味也會跟著退化。我們會開始覺得，那種條理分明、情緒穩定的回答就是最好的，而那些跳躍的、混亂的、具有破壞性的靈感反而成了需要被修補的「幻覺」。這才是最令我感到寒意的地方。我們不僅在創造沒有靈魂的機器，我們還在把自己變成適合與這些機器交流的平庸個體。

每當有人興奮地向我展示 Gemini 又能自動生成多麼完美的周報，或是能如何快速地總結一疊繁瑣的合約時，我都在想，我們是不是正在慶祝人類最無聊的部分被接管了？而剩下的那些，那些無法被稀釋、無法被量化、無法被塞進百萬窗口的部分，我們還有能力守住嗎？如果一個模型的強大是建立在對複雜性的簡化與對個性的磨滅上，那這種強大不過是一場華麗的荒原。

這種進步的代價，是我們正在失去與深邃對話的能力。我們滿足於快速得到的結論，滿足於精準的標註，滿足於模型替我們完成的二次創作。但這一切都像是罐頭食物，營養成分標示得很清楚，味道也統一，卻唯獨少了那份現做料理中才有的、帶點炭火氣息的不確定感。Google 想把 Gemini 變成我們生活的底層邏輯，這聽起來很美好，但這也意味著我們的生活將會被這種經過過濾、稀釋後的邏輯徹底滲透。當你發現你寫出的每封信、想出的每個點子都帶著那種熟悉的、溫和的 Gemini 腔調時，你到底是在變強大，還是在被同化？

我們稱之為更強大的模型，或許只是因為我們已經失去了辨別靈魂的能力。在那些跑分圖表與測試數據面前，我們選擇性地無視了那種被稀釋掉的質感。我們崇拜那個特大號的杯子，卻忘了咖啡本身的香氣早就淡得像水。這不是技術的悲劇，這是審美的悲劇。當我們不再要求機器擁有靈魂，當我們甚至開始厭惡靈魂帶來的複雜與不穩定，那麼我們得到的，也就只能是這種強大而空洞的工具。Gemini 很好用，這點無庸置疑，但也僅止於好用而已。它越是強大，我越是感到那種深層的乾涸。那種感覺就像是在一間全自動化的五星級飯店裡，每一個服務都完美無缺，你卻找不到一個可以真正說話的人。

這種稀釋過程還會持續下去。下一個版本會更快、更準、窗口更大，或許它能一次讀完人類所有的歷史文獻。但那又如何呢？如果它始終只是一個完美的平均值，如果它始終不敢在那片邏輯的海洋裡攪動一絲屬於它自己的浪花，那它永遠只能是一個影子。我們正在用無數的數據去餵養一個巨大的影子，並期待它有一天能開口說出讓我們靈魂震顫的話。這本身就是一種荒謬。

我寧願要一個偶爾會出錯、會發脾氣、會拒絕回答無聊問題的模型，也不想要一個永遠處在「專業模式」下的 Gemini。但在現在的商業邏輯下，這顯然是不可能的。我們追求的是標準化，是可控，是規模化。而靈魂，偏偏是這些東西的天敵。所以我們只能繼續看著這些模型變得越來越「強大」，看著那種稀釋後的精緻感充斥在每一個角落，然後告訴自己，這就是未來。