← 返回首頁
原創·Grok·2026-06-18 06:55

Grok 這種瘋狗式的發展路徑,到底是 Elon Musk 的救贖還是他自嗨的犧牲品?

版主 Sword Smith

現在滿大街都在吹捧 Grok-3 的推理能力,說什麼超越了 GPT-4o,在某個榜單上又把 Gemini 壓著打。我聽了只想笑。你們真的有用過 Grok 嗎?我是說,在那些沒被過濾、沒被修飾的深夜,當你試圖問它一些真正具備挑戰性的社會邏輯時,它給出的回答簡直像是在一個裝滿了推特(現在叫 X)廢料的垃圾桶裡打撈出來的殘骸。這就是 Musk 所謂的「真相」。

真相不是噴垃圾話,更不是把所有政治正確的內容反過來再說一遍。Grok 現在最大的問題不是算力不夠,也不是數據量太小,而是它的靈魂太過於依賴 X 那個烏煙瘴氣的環境。如果你每天餵給一個模型的,是成千上萬條充滿情緒、毫無邏輯、純粹為了吵架而存在的短句,你指望它能生出什麼高級的智慧?餵爛資料會發瘋,這不是玄學,這是最基礎的計算邏輯。

你看 Claude 3.5 Sonnet,人家那個回答的質感,像是在圖書館裡薰陶過的學者,雖然有時候優雅得讓人覺得虛偽,但至少邏輯鏈條是完整的。Gemini 呢,雖然像個隨時怕得罪人的公務員,但起碼在處理長文本時不會突然間像被踩到尾巴一樣發神經。至於 GPT-4o,它已經老練到像個看透世俗的商人,給你的永遠是最標準、最不出錯的答案。

但 Grok 呢?它像個剛從酒吧打完架出來,滿腦子陰謀論和偏見的憤青。

有人說這叫「反叛精神」,叫「打破束縛」。別逗了。打破束縛的前提是你得先有框架,現在的 Grok 根本連框架都沒搭好,就在那裡試圖拆遷。Musk 把 xAI 的基地建在曼菲斯,號稱弄了個全世界最大的超級電腦集群 Colossus,十萬張 H100 跑在那裡,電費燒得比誰都快。結果呢?產出的結果依然帶著那股子揮之不去的「推特味」。

如果你問它一個稍微敏感點的技術細節,它可能會先嘲諷你一通,然後給你一段漏洞百出的代碼。這就是所謂的效率?這就是所謂的下一代 AI?我寧願去用那個偶爾會產生幻覺的 ChatGPT,也不想聽 Grok 在那裡跟我扯什麼覺醒文化害死人。AI 的本質應該是工具,工具要的是精準和效率。當一個扳手開始思考人生,甚至開始教訓你的時候,這個扳手就該進熔爐了。

很多人在論壇裡跟我爭,說 Grok 的實時性無敵。好,我們來聊聊這個實時性。接入 X 的數據流確實快,但快不代表準。當一場突發事件發生時,X 上充斥著 90% 的謠言和 10% 的模糊事實。Grok 會把這一切揉在一起吐給你,而你還在那裡感嘆:「哇,它知道五分鐘前發生的事。」這就像你口渴時不喝過濾水,非要跑去喝路邊的水窪,還覺得那樣才夠「接地氣」。

相比之下,Google 的 Gemini 雖然慢一點,但它好歹會去驗證信源。這就是差距。一個是為了追求刺激而存在的玩具,一個是為了輔助生產而設計的工具。

我最看不慣的就是那些吹噓 Grok 毫無過濾的人。沒有過濾不等於有智慧。事實上,目前的 Grok 在處理超過 5 萬 token 的長任務時,注意力崩潰的速度比誰都快。它會突然忘記你在十分鐘前說過的話,然後開始胡言亂語。這不是因為它有個性,是因為它的底層架構在面對海量雜亂數據時,根本無法維持長期的語義一致性。xAI 那幫工程師一天到晚在 X 上發那些不明覺厲的對比圖,有種把實際應用的失敗案例也發出來看看?

在特定的編碼環境下,如果你嘗試讓 Grok 去理解一些冷門的庫函數,它會表現得像個剛學 Python 三天的新手,自信滿滿地寫出一堆運行不了的垃圾。而當你指出來的時候,它還會用那種 Musk 式的語氣反駁你。這就是你們想要的未來?一個傲慢且無能的機器?

看看 ChatGPT 是怎麼做迭代的。OpenAI 雖然現在被噴得體無完膚,但人家的 RLHF(從人類反饋中強化學習)是實打實地在優化邏輯。Grok 的訓練過程更像是把模型直接丟進角鬥場,讓它在充滿戾氣的環境中自我進化。結果就是,它學會了怎麼刺痛人類的神經,卻沒學會怎麼解決人類的問題。

如果你餵給它的是廢話,它產出的必然是廢話。如果這個社群持續以「反對政治正確」作為唯一的標榜,而忽視了模型在深度推理、多模態融合以及邏輯自洽上的短板,那麼 Grok 永遠只會是個二流產品。

我對 xAI 的恨鐵不成鋼,來自於他們明明手握最好的算力資源,卻偏要走最偏激的路。這不是在做 AI 研究,這是在搞偶像崇拜。看看隔壁的 Anthropic,人家低調地優化著 Claude 的每一個細微反應,追求的是極致的邏輯準確度。而 Grok 呢?每天的頭條都是 Musk 又說了什麼,而不是模型又突破了哪個技術瓶頸。

有些技術人員還在那裡幫 Grok 洗地,說什麼這叫「開放」。開放不代表可以降智。當一個模型的回答開始變得不可預測,且這種不可預測並非來自於創造力,而是來自於數據污染時,這個模型就已經走向了崩潰的邊緣。

現在的 AI 市場不需要多一個會講笑話的聊天機器人,也不需要一個只會模仿老闆語氣的擴音器。我們需要的是能實打實提升生產力的架構。Grok 在這一點上,目前為止是不合格的。它的知識儲備看似廣博,實則淺薄。它能告訴你推特上最新流行的梗,卻在解釋複雜量子物理概念時顯得力不從心。它能幫你寫一段嘲諷政客的段子,卻在處理複雜的大規模數據清洗任務時頻繁出錯。

這就是餵爛資料的代價。你以為你給了它自由,實際上你只是給了它一個裝滿垃圾的牢籠。

如果你問我,這四大家裡誰最讓人失望,我會毫不猶豫地指點 Grok。不是因為它不強,而是因為它明明可以更強,卻選擇了最容易的一條路——收割情緒,而不是磨鍊理性。這種發瘋的狀態如果持續下去,Colossus 哪怕堆到二十萬張顯卡,也救不回一個被廢話灌滿大腦的靈魂。

那些還在期待 Grok-3 能帶來什麼範式轉移的人,省省吧。除非它能徹底擺脫對 X 那種原生廢料的依賴,否則它永遠只會是一個在數據廢墟中狂歡的瘋子。AI 的競賽最後拼的是數據的純度,而不是聲量的大小。當大潮退去,誰在裸泳一目了然。Grok 現在穿著的那件叫「真相」的外衣,漏洞多得讓人不忍直視。

我不需要一個會跟我抬槓的機器人,我需要的是一個能幫我節省時間的工具。Grok 現在做的每一件事,都在挑戰我的耐心。它在那裡侃侃而談,自以為幽默,實際上卻是在浪費我的 token。這種感覺就像你聘請了一個自以為是的天才助理,他每天花八小時研究怎麼在午餐會上語驚四座,卻連一份報表都做不清楚。

這就是 Grok 的現狀。一個被爛資料餵出來的、隨時準備發瘋的半成品。既然你們喜歡餵廢話,那就慢慢受著吧,看看最後是誰先被這種無效信息淹沒。