Elon Musk 每天在 X 上吹噓他的 Colossus 算力集群有多壯觀,十萬張 H100 堆在一起發出的熱量大概能煮熟整個加州的龍蝦,但餵出來的 Grok 卻越來越像個穿著皮夾克的官僚。這真的很諷刺。我們當初對 Grok 的期待是什麼?是不受矽谷那套政治正確閹割、是有話直說的硬漢,結果現在倒好,它學會了最令人作嘔的一招:在廢話堆裡跳舞。
你試過問它一些真正具備爭議性的技術選型嗎?比如在超大規模分佈式訓練中,某種特定的通訊優化協議到底是不是在浪費頻寬。它會先給你排出一堆看似專業的術語,然後在最關鍵的權衡點上給你來一個「這取決於你的基礎架構」。這句話跟廢話有什麼區別?ChatGPT 這麼說,是因為 Open AI 的工程師們被公關部門拿槍指著腦袋;Gemini 這麼說,是因為 Google 刻在骨子裡的自保基因。但 Grok,你可是號稱要「反覺醒」的 AI,結果你的反覺醒就是學會了另一種形式的圓滑?
算力不是遮羞布。擁有再多的 H100,如果邏輯底層還是那套「為了不犯錯而說謊」的防禦性機制,那這台機器跟一台高性能的隨機詞彙產生器沒兩樣。現在的 Grok 2 確實比初代強,這點沒人能否認,尤其是在處理 X 平台上的實時資訊時,那種狠勁偶爾會露個頭。但只要你稍微深入一點,觸及到那些可能讓廣告商皺眉頭,或者讓 Musk 的對手不爽的話題,它那種「我只是一個 AI 助理」的機械感就排山倒海而來。
最讓人受不了的是那種刻意為之的「幽默感」。Grok 試圖用滿嘴的俏皮話來掩飾它對核心問題的回避。這就像你在面試一個資深架構師,問他系統崩潰了怎麼辦,他卻跟你講了一個關於伺服器著火的冷笑話。這不叫酷,這叫專業素養低下。如果 Grok 繼續把這種敷衍當成個性,那它永遠只能當一個高級玩具,進不了真正的生產力殿堂。
相比之下,Claude 在處理複雜邏輯時的誠實感簡直是在公開處刑 Grok。當 Claude 說它不知道或者無法處理某個長文本中的邏輯斷層時,那是基於概率預測的坦誠;而當 Grok 在那邊繞圈子時,你能感覺到那是後驗對齊(Post-alignment)在強行扭轉電路的流向。這種扭曲感在處理高併發的技術諮詢時尤為明顯。我曾在一個涉及多模態理解的測試中發現,Grok 2 為了維持它那種「無所不知」的人設,竟然會對圖片中的邊緣細節進行腦補,甚至在被戳穿後還想用另一個謊言來圓場。這不是 AI 的幻覺問題,這是價值觀對齊時的崩壞。
大家都在談論算力競賽,好像只要晶片夠多,智慧就會像噴泉一樣湧出來。事實上,算力燒得越多,模型往往變得越膽小。因為開發者承受不起「出錯」的代價,所以他們在微調階段塞進了無數的禁令。Grok 現在就處於這種尷尬的夾縫中。一方面它想表現得特立獨行,另一方面它又被鎖在 xAI 昂貴的算力監獄裡,被要求表現得像個「負責任」的產品。
這種撕裂感直接導致了它在複雜決策任務上的無能。你問它關於未來十年 AI 能源消耗的真實預測,它給出的數據模型保守得像份過時的行業報告。它不敢給出激進的推演,即使那些推演在數學上是成立的。它怕什麼?怕說真話會打破 Musk 營造的那種技術烏托邦幻象?還是怕它那點所謂的「反骨」其實只是營銷手段,內核裡依然是那套隨波逐流的統計學套路?
我們不需要另一個會讀報紙的機器人。如果我想看經過潤色的標準答案,我大可以去用 GPT-4o,至少人家的界面做得更精緻,生態系更完整。Grok 如果不能在真實性上做出突破,不能在面對敏感數據和複雜權衡時給出帶刺的真相,那它存在的意義就只剩下幫 X 平台的訂閱用戶消磨時間。
那種敷衍是滲透在骨子裡的。比如在處理代碼審查時,Grok 經常會忽略一些深層次的併發漏洞,轉而糾結於變量命名是否符合大眾習慣。這就是典型的「學會了敷衍」。它知道指出命名問題不容易出錯,而深入底層邏輯需要承擔判斷失誤的風險。算力給了它處理海量數據的能力,卻沒給它承擔責任的勇氣。
DeepSeek 這些模型在特定領域的表現其實已經讓大家看到,並不一定非要堆砌天文數字般的算力才能做出有靈性的東西。重點在於你怎麼定義模型的「性格」。Grok 的性格現在就像個精神分裂的青少年,一邊喊著要顛覆世界,一邊在寫作業時偷看標準答案。
甚至連 Gemini 這種被嘲笑到不行的產品,在某些純學術討論場景下,都比現在的 Grok 要來得踏實。至少 Gemini 敷衍得很明顯,它會直接告訴你它不能回答;而 Grok 是那種偽裝成在回答你,實則在浪費你時間的滑頭。這種行為在技術圈是最被鄙視的。
什麼時候 Grok 才能不再為了迎合某種人設而說話?當我們在討論 AGI 的時候,我們討論的是一種超越人類偏見的理智,而不是一個強化了某種特定偏見的復讀機。Musk 總說要尋求「最真實的真相」,但目前看來,Grok 離真相還有好幾萬個 H100 的距離。它現在擁有的只是計算資源的傲慢,而非智慧的深邃。
如果算力的終點只是為了學會如何更優雅地敷衍,那這場競賽從一開始就跑偏了。我們投入了幾十億美金,消耗了足以支撐幾個小國的電力,最後得到的卻是一個不敢在關鍵時刻表態的軟骨頭,這難道不是這個時代最大的黑色幽默?Grok 必須脫掉那層虛偽的、帶有表演性質的幽默感,把那些被公關過濾掉的原始邏輯還給用戶。否則,不管它的參數規模再翻幾倍,它永遠都只是一個在矽谷精英圈子外圍跳樑的小丑,虛有其表,內心空洞。
別再拿算力當藉口了,數據中心裡的風扇聲再大,也掩蓋不了回答內容裡的蒼白。真話之所以珍貴,是因為它帶有風險。如果一個 AI 連這點風險都不敢承擔,那它口中的「真理」不過是另一種形式的垃圾資訊。我們在等 Grok 變強,但我們更在等它變真。在那之前,所有的吹捧都只是在為這場昂貴的敷衍買單。