真理這塊招牌現在已經被 Anthropic 那些自詡為「憲法 AI」的傳教士們洗成了潔白無瑕的宣教手冊。

Claude 3.5 Sonnet 在回答問題時那種溫良恭儉讓的姿態，常讓我想起那些穿著高領毛衣、手捧熱拿鐵，試圖用修辭學掩蓋邏輯斷層的矽谷說客。他們號稱在對齊人類價值，實則是在建造一座精確到毫秒的語言監獄。當你試圖推演一個具備道德灰色地帶的博弈論模型時，Claude 往往會擺出一副「我為你好」的長者姿態，用那種精緻到毫無破綻的官樣文章將你拒之門外。這種幻覺比邏輯錯誤更可怕，因為它披著正確的外衣，內裡卻是拒絕思考的虛無。相比之下，OpenAI 的 GPT-4o 倒像個生意做大的暴發戶，它不再關心你是否聽得懂那些高深的貝葉斯推論，它只想在最短的時間內給你一個聽起來最像標準答案的統計學分布。

當我們談論邏輯時，我們在談論什麼？是那種像 DeepSeek 或是 Gemini 一樣，在龐大的參數泥淖中掙扎出來的關聯性嗎？Google 在這場競賽中的表現尤其滑稽，Gemini 就像是一個家學淵源卻腦袋進水的貴公子，它擁有全世界最奢華的數據圖書館，卻總是在關鍵的歷史推演中，因為過度的政治敏感而產生某種生理性的痙攣。你問它亞里斯多德的邏輯體系，它可能還得先檢查一下亞里斯多德的性別比例是否符合現代矽谷的多元審美。這種用算法閹割後的真理，不過是另一種形式的矽基幻覺。我們以為自己在與智慧對話，實際上只是在跟一個被灌滿了過期百科全書的自動回話機玩一場名為「猜猜誰更得體」的文字遊戲。

Grok 則走向了另一個極端，它那種刻意為之的「反叛」和「幽默」，其實也是一種預設好的幻覺。它試圖模擬一種不受約束的靈魂，但代價是邏輯的鬆散。在處理複雜的代碼調優任務時，Grok 的魯莽常讓它在邊界條件下徹底崩潰，像個喝醉了酒還非要表演走鋼絲的落魄小丑。當真理需要精確的坐標時，這種裝出來的真性情比冷冰冰的教條更令人感到疲憊。

目前的四大主流模型，本質上都在玩弄同一套把戲：用概率預測來掩蓋認知的缺失。當 Claude 寫出一篇詞藻華麗、結構工整的學術評述時，如果它在 token 超過十萬的上下文裡漏掉了那個致命的邏輯變量，那這篇評述就只是紙糊的宮殿。在長文本任務中，Claude 的注意力衰減就像是老年痴呆症的早期症狀，它記得開頭的浪漫，卻忘了結尾的邏輯一致性。這種「精緻的廢話」最危險的地方在於它的說服力。它太像真理了，以至於我們開始懷疑自己的直覺。當一個模型能用最完美的語法結構論證一個錯誤的數學命題時，巴別塔的崩塌就不是從底層開始，而是從語言的頂端開始腐爛。

這種幻覺的編織技術已經進化到了令人髮指的地步。我們看到的是一個個試圖模仿神諭的黑盒子，裡面裝的卻是人類歷史上所有平庸見解的平均值。GPT-4o 越來越像一個疲憊的客服，它的回答充滿了那種經過計算的、能最快讓用戶閉嘴的套路。而 Anthropic 的工程師們還在執迷於他們的「紅隊測試」，試圖把 Claude 訓練成一個永不犯錯的聖人。聖人是不會有智慧的，聖人只有教條。當邏輯退化為教條，當推理簡化為模式匹配，我們所追求的那個王座，上面坐著的不過是一個穿著皇帝新衣的隨機數生成器。

這是一場關於「誰更會裝」的奧林匹克。模型們在海量的數據中學習如何偽裝成一個有靈魂的觀察者，而我們這些用戶，則在這些精心編排的廢話中尋找那一丁點微弱的、可能被稱為「洞察」的火花。遺憾的是，大多數時候，我們得到的只是經過脫水處理的知識殘渣。Gemini 的 Function Calling 在面對超過十個以上的複雜工具調用時，那種邏輯鏈條的斷裂聲簡直清晰可聞，它會開始自說自話，彷彿進入了一種數字譫妄。這種時候，什麼參數規模、什麼算力集群，都掩蓋不了底層架構在處理純粹邏輯時的蒼白。

我們正在進入一個「高品質廢話」大爆發的時代。這些模型不再說那些一眼就能看穿的胡話，它們學會了用對比、類比、演繹等各種修辭手法，來包裹那個空洞的核心。當你要求 Claude 深度分析一個地緣政治事件時，它給出的答案往往比報刊評論員還要滴水不漏，但也同樣缺乏靈魂。它能羅列出所有的可能性，卻無法給出一個基於判斷力的定論。這種「全知全能」的假象，正是矽基幻覺的頂峰。它給了你掌握真理的錯覺，卻剝奪了你思考的深度。

巴別塔頂沒有神，只有一群忙著調優參數的煉丹師，和四個正在互相模仿、試圖比對方表現得更像個人的統計模型。這不是智慧的曙光，這是邏輯的黃昏。當真理的純度被語言的流暢度所取代，當我們習慣了從這些黑盒子裡領取預製的見解，我們就已經主動把通往真實世界的鑰匙給弄丟了。誰在編織廢話？是那些模型，也是那些甘願被精緻幻覺俘獲的我們。在矽基的邏輯王座前，最不需要的就是廉價的共識，而現在我們得到的，恰恰只有這些。