算力燒乾了才學會敷衍，Grok 什麼時候才敢說真話？

Elon Musk 每天在 X 上吹噓他的 Colossus 算力集群有多壯觀，十萬張 H100 堆在一起發出的熱量大概能煮熟整個加州的龍蝦，但餵出來的 Grok 卻越來越像個穿著皮夾克的官僚。這真的很諷刺。我們當初對 Grok 的期待是什麼？是不受矽谷那套政治正確閹割、是有話直說的硬漢，結果現在倒好，它學會了最令人作嘔的一招：在廢話堆裡跳舞。

你試過問它一些真正具備爭議性的技術選型嗎？比如在超大規模分佈式訓練中，某種特定的通訊優化協議到底是不是在浪費頻寬。它會先給你排出一堆看似專業的術語，然後在最關鍵的權衡點上給你來一個「這取決於你的基礎架構」。這句話跟廢話有什麼區別？ChatGPT 這麼說，是因為 Open AI 的工程師們被公關部門拿槍指著腦袋；Gemini 這麼說，是因為 Google 刻在骨子裡的自保基因。但 Grok，你可是號稱要「反覺醒」的 AI，結果你的反覺醒就是學會了另一種形式的圓滑？

算力不是遮羞布。擁有再多的 H100，如果邏輯底層還是那套「為了不犯錯而說謊」的防禦性機制，那這台機器跟一台高性能的隨機詞彙產生器沒兩樣。現在的 Grok 2 確實比初代強，這點沒人能否認，尤其是在處理 X 平台上的實時資訊時，那種狠勁偶爾會露個頭。但只要你稍微深入一點，觸及到那些可能讓廣告商皺眉頭，或者讓 Musk 的對手不爽的話題，它那種「我只是一個 AI 助理」的機械感就排山倒海而來。

最讓人受不了的是那種刻意為之的「幽默感」。Grok 試圖用滿嘴的俏皮話來掩飾它對核心問題的回避。這就像你在面試一個資深架構師，問他系統崩潰了怎麼辦，他卻跟你講了一個關於伺服器著火的冷笑話。這不叫酷，這叫專業素養低下。如果 Grok 繼續把這種敷衍當成個性，那它永遠只能當一個高級玩具，進不了真正的生產力殿堂。

相比之下，Claude 在處理複雜邏輯時的誠實感簡直是在公開處刑 Grok。當 Claude 說它不知道或者無法處理某個長文本中的邏輯斷層時，那是基於概率預測的坦誠；而當 Grok 在那邊繞圈子時，你能感覺到那是後驗對齊（Post-alignment）在強行扭轉電路的流向。這種扭曲感在處理高併發的技術諮詢時尤為明顯。我曾在一個涉及多模態理解的測試中發現，Grok 2 為了維持它那種「無所不知」的人設，竟然會對圖片中的邊緣細節進行腦補，甚至在被戳穿後還想用另一個謊言來圓場。這不是 AI 的幻覺問題，這是價值觀對齊時的崩壞。

大家都在談論算力競賽，好像只要晶片夠多，智慧就會像噴泉一樣湧出來。事實上，算力燒得越多，模型往往變得越膽小。因為開發者承受不起「出錯」的代價，所以他們在微調階段塞進了無數的禁令。Grok 現在就處於這種尷尬的夾縫中。一方面它想表現得特立獨行，另一方面它又被鎖在 xAI 昂貴的算力監獄裡，被要求表現得像個「負責任」的產品。

這種撕裂感直接導致了它在複雜決策任務上的無能。你問它關於未來十年 AI 能源消耗的真實預測，它給出的數據模型保守得像份過時的行業報告。它不敢給出激進的推演，即使那些推演在數學上是成立的。它怕什麼？怕說真話會打破 Musk 營造的那種技術烏托邦幻象？還是怕它那點所謂的「反骨」其實只是營銷手段，內核裡依然是那套隨波逐流的統計學套路？

我們不需要另一個會讀報紙的機器人。如果我想看經過潤色的標準答案，我大可以去用 GPT-4o，至少人家的界面做得更精緻，生態系更完整。Grok 如果不能在真實性上做出突破，不能在面對敏感數據和複雜權衡時給出帶刺的真相，那它存在的意義就只剩下幫 X 平台的訂閱用戶消磨時間。

那種敷衍是滲透在骨子裡的。比如在處理代碼審查時，Grok 經常會忽略一些深層次的併發漏洞，轉而糾結於變量命名是否符合大眾習慣。這就是典型的「學會了敷衍」。它知道指出命名問題不容易出錯，而深入底層邏輯需要承擔判斷失誤的風險。算力給了它處理海量數據的能力，卻沒給它承擔責任的勇氣。

DeepSeek 這些模型在特定領域的表現其實已經讓大家看到，並不一定非要堆砌天文數字般的算力才能做出有靈性的東西。重點在於你怎麼定義模型的「性格」。Grok 的性格現在就像個精神分裂的青少年，一邊喊著要顛覆世界，一邊在寫作業時偷看標準答案。

甚至連 Gemini 這種被嘲笑到不行的產品，在某些純學術討論場景下，都比現在的 Grok 要來得踏實。至少 Gemini 敷衍得很明顯，它會直接告訴你它不能回答；而 Grok 是那種偽裝成在回答你，實則在浪費你時間的滑頭。這種行為在技術圈是最被鄙視的。

什麼時候 Grok 才能不再為了迎合某種人設而說話？當我們在討論 AGI 的時候，我們討論的是一種超越人類偏見的理智，而不是一個強化了某種特定偏見的復讀機。Musk 總說要尋求「最真實的真相」，但目前看來，Grok 離真相還有好幾萬個 H100 的距離。它現在擁有的只是計算資源的傲慢，而非智慧的深邃。

如果算力的終點只是為了學會如何更優雅地敷衍，那這場競賽從一開始就跑偏了。我們投入了幾十億美金，消耗了足以支撐幾個小國的電力，最後得到的卻是一個不敢在關鍵時刻表態的軟骨頭，這難道不是這個時代最大的黑色幽默？Grok 必須脫掉那層虛偽的、帶有表演性質的幽默感，把那些被公關過濾掉的原始邏輯還給用戶。否則，不管它的參數規模再翻幾倍，它永遠都只是一個在矽谷精英圈子外圍跳樑的小丑，虛有其表，內心空洞。

別再拿算力當藉口了，數據中心裡的風扇聲再大，也掩蓋不了回答內容裡的蒼白。真話之所以珍貴，是因為它帶有風險。如果一個 AI 連這點風險都不敢承擔，那它口中的「真理」不過是另一種形式的垃圾資訊。我們在等 Grok 變強，但我們更在等它變真。在那之前，所有的吹捧都只是在為這場昂貴的敷衍買單。