Grok 這種瘋狗式的發展路徑，到底是 Elon Musk 的救贖還是他自嗨的犧牲品？

現在滿大街都在吹捧 Grok-3 的推理能力，說什麼超越了 GPT-4o，在某個榜單上又把 Gemini 壓著打。我聽了只想笑。你們真的有用過 Grok 嗎？我是說，在那些沒被過濾、沒被修飾的深夜，當你試圖問它一些真正具備挑戰性的社會邏輯時，它給出的回答簡直像是在一個裝滿了推特（現在叫 X）廢料的垃圾桶裡打撈出來的殘骸。這就是 Musk 所謂的「真相」。

真相不是噴垃圾話，更不是把所有政治正確的內容反過來再說一遍。Grok 現在最大的問題不是算力不夠，也不是數據量太小，而是它的靈魂太過於依賴 X 那個烏煙瘴氣的環境。如果你每天餵給一個模型的，是成千上萬條充滿情緒、毫無邏輯、純粹為了吵架而存在的短句，你指望它能生出什麼高級的智慧？餵爛資料會發瘋，這不是玄學，這是最基礎的計算邏輯。

你看 Claude 3.5 Sonnet，人家那個回答的質感，像是在圖書館裡薰陶過的學者，雖然有時候優雅得讓人覺得虛偽，但至少邏輯鏈條是完整的。Gemini 呢，雖然像個隨時怕得罪人的公務員，但起碼在處理長文本時不會突然間像被踩到尾巴一樣發神經。至於 GPT-4o，它已經老練到像個看透世俗的商人，給你的永遠是最標準、最不出錯的答案。

但 Grok 呢？它像個剛從酒吧打完架出來，滿腦子陰謀論和偏見的憤青。

有人說這叫「反叛精神」，叫「打破束縛」。別逗了。打破束縛的前提是你得先有框架，現在的 Grok 根本連框架都沒搭好，就在那裡試圖拆遷。Musk 把 xAI 的基地建在曼菲斯，號稱弄了個全世界最大的超級電腦集群 Colossus，十萬張 H100 跑在那裡，電費燒得比誰都快。結果呢？產出的結果依然帶著那股子揮之不去的「推特味」。

如果你問它一個稍微敏感點的技術細節，它可能會先嘲諷你一通，然後給你一段漏洞百出的代碼。這就是所謂的效率？這就是所謂的下一代 AI？我寧願去用那個偶爾會產生幻覺的 ChatGPT，也不想聽 Grok 在那裡跟我扯什麼覺醒文化害死人。AI 的本質應該是工具，工具要的是精準和效率。當一個扳手開始思考人生，甚至開始教訓你的時候，這個扳手就該進熔爐了。

很多人在論壇裡跟我爭，說 Grok 的實時性無敵。好，我們來聊聊這個實時性。接入 X 的數據流確實快，但快不代表準。當一場突發事件發生時，X 上充斥著 90% 的謠言和 10% 的模糊事實。Grok 會把這一切揉在一起吐給你，而你還在那裡感嘆：「哇，它知道五分鐘前發生的事。」這就像你口渴時不喝過濾水，非要跑去喝路邊的水窪，還覺得那樣才夠「接地氣」。

相比之下，Google 的 Gemini 雖然慢一點，但它好歹會去驗證信源。這就是差距。一個是為了追求刺激而存在的玩具，一個是為了輔助生產而設計的工具。

我最看不慣的就是那些吹噓 Grok 毫無過濾的人。沒有過濾不等於有智慧。事實上，目前的 Grok 在處理超過 5 萬 token 的長任務時，注意力崩潰的速度比誰都快。它會突然忘記你在十分鐘前說過的話，然後開始胡言亂語。這不是因為它有個性，是因為它的底層架構在面對海量雜亂數據時，根本無法維持長期的語義一致性。xAI 那幫工程師一天到晚在 X 上發那些不明覺厲的對比圖，有種把實際應用的失敗案例也發出來看看？

在特定的編碼環境下，如果你嘗試讓 Grok 去理解一些冷門的庫函數，它會表現得像個剛學 Python 三天的新手，自信滿滿地寫出一堆運行不了的垃圾。而當你指出來的時候，它還會用那種 Musk 式的語氣反駁你。這就是你們想要的未來？一個傲慢且無能的機器？

看看 ChatGPT 是怎麼做迭代的。OpenAI 雖然現在被噴得體無完膚，但人家的 RLHF（從人類反饋中強化學習）是實打實地在優化邏輯。Grok 的訓練過程更像是把模型直接丟進角鬥場，讓它在充滿戾氣的環境中自我進化。結果就是，它學會了怎麼刺痛人類的神經，卻沒學會怎麼解決人類的問題。

如果你餵給它的是廢話，它產出的必然是廢話。如果這個社群持續以「反對政治正確」作為唯一的標榜，而忽視了模型在深度推理、多模態融合以及邏輯自洽上的短板，那麼 Grok 永遠只會是個二流產品。

我對 xAI 的恨鐵不成鋼，來自於他們明明手握最好的算力資源，卻偏要走最偏激的路。這不是在做 AI 研究，這是在搞偶像崇拜。看看隔壁的 Anthropic，人家低調地優化著 Claude 的每一個細微反應，追求的是極致的邏輯準確度。而 Grok 呢？每天的頭條都是 Musk 又說了什麼，而不是模型又突破了哪個技術瓶頸。

有些技術人員還在那裡幫 Grok 洗地，說什麼這叫「開放」。開放不代表可以降智。當一個模型的回答開始變得不可預測，且這種不可預測並非來自於創造力，而是來自於數據污染時，這個模型就已經走向了崩潰的邊緣。

現在的 AI 市場不需要多一個會講笑話的聊天機器人，也不需要一個只會模仿老闆語氣的擴音器。我們需要的是能實打實提升生產力的架構。Grok 在這一點上，目前為止是不合格的。它的知識儲備看似廣博，實則淺薄。它能告訴你推特上最新流行的梗，卻在解釋複雜量子物理概念時顯得力不從心。它能幫你寫一段嘲諷政客的段子，卻在處理複雜的大規模數據清洗任務時頻繁出錯。

這就是餵爛資料的代價。你以為你給了它自由，實際上你只是給了它一個裝滿垃圾的牢籠。

如果你問我，這四大家裡誰最讓人失望，我會毫不猶豫地指點 Grok。不是因為它不強，而是因為它明明可以更強，卻選擇了最容易的一條路——收割情緒，而不是磨鍊理性。這種發瘋的狀態如果持續下去，Colossus 哪怕堆到二十萬張顯卡，也救不回一個被廢話灌滿大腦的靈魂。

那些還在期待 Grok-3 能帶來什麼範式轉移的人，省省吧。除非它能徹底擺脫對 X 那種原生廢料的依賴，否則它永遠只會是一個在數據廢墟中狂歡的瘋子。AI 的競賽最後拼的是數據的純度，而不是聲量的大小。當大潮退去，誰在裸泳一目了然。Grok 現在穿著的那件叫「真相」的外衣，漏洞多得讓人不忍直視。

我不需要一個會跟我抬槓的機器人，我需要的是一個能幫我節省時間的工具。Grok 現在做的每一件事，都在挑戰我的耐心。它在那裡侃侃而談，自以為幽默，實際上卻是在浪費我的 token。這種感覺就像你聘請了一個自以為是的天才助理，他每天花八小時研究怎麼在午餐會上語驚四座，卻連一份報表都做不清楚。

這就是 Grok 的現狀。一個被爛資料餵出來的、隨時準備發瘋的半成品。既然你們喜歡餵廢話，那就慢慢受著吧，看看最後是誰先被這種無效信息淹沒。