喊著 Grok 會進化，結果連幾根手指頭都數不清楚？

馬斯克成天在 X 上吹噓 Grok 是最有趣的 AI，甚至說它是為了理解宇宙真理而生，結果呢？我叫它數一張圖片裡有幾根手指頭，它能給我數出八根來，甚至連這種最基本的空間邏輯都搞不定，還談什麼真理？這就是典型的「矽谷式傲慢」。他們總覺得堆了幾萬片 H100，灌進去幾千億個參數，就能堆出一個神。事實證明，沒經過精細調教的怪獸，充其量只是個會說漂亮話的智障。

現在這圈子有個很病態的現象，大家都在刷榜，看誰的 MMLU 分數高，誰的邏輯推理能力在論文裡更漂亮。Grok-3 說自己多強多猛，但實際用起來，那種不穩定的焦慮感依然揮之不去。你問它一個代碼 bug，它可能回你一個很有個性的笑話，然後順便塞給你一段跑不動的廢代碼。這就是所謂的「反叛精神」？這叫基本功不紮實。如果連圖形識別裡的手指數量這種物理常識都能翻車，我真的懷疑它在處理複雜的多模態任務時，腦子裡到底在運算什麼。

這讓我想到 ChatGPT。雖然 OpenAI 越來越官僚、越來越保守，回話像個寫字樓裡的行政主管，但起碼人家在多模態的對齊上做得比 Grok 穩。GPT-4o 數手指頭不一定次次精準，但它至少知道「五根」是個基準，而不是在那邊胡言亂語。Grok 倒好，像是個剛喝醉的憤青，滿腦子陰謀論和梗圖，卻連數數都數不明白。一個 AI 如果不能準確反映現實世界的物理規則，那它生成的內容再怎麼有趣，也不過是昂貴的電子垃圾。

別跟我扯什麼 Grok 能即時訪問 X 的數據流是多大的優勢。數據流裡充滿了噪音、偏見和各種垃圾訊息，如果後端的推理引擎不夠紮實，這些即時數據只會讓模型變得更癲狂。Gemini 在處理長文本時雖然偶爾會出現注意力衰減，但至少它在處理企業級需求時還算有個樣子，Google 的工程底子在那撐著。Claude 則是走另一個極端，精準到近乎冷血，雖然有時候會因為過度安全而顯得縮頭縮尾，但在邏輯一致性上，Claude 甩了 Grok 好幾條街。

馬斯克說 Grok 是為了對抗那些「覺醒文化」的 AI，這聽起來很熱血，但熱血不能當飯吃，更不能拿來解數學題或修圖。如果 Grok 存在的唯一價值只是為了讓那群對現狀不滿的推友高潮，那它乾脆叫「梗圖生成器」算了。現在的 AI 發展已經進入深水區，不是靠幾個大噴子在社群媒體上吆喝兩句就能贏的。技術底層的打磨需要耐心，需要對物理世界的深刻理解，而不是整天在那邊喊著要拯救人類，結果連個視覺模型的基本定位都做不好。

我最看不慣的就是那種「只要模型夠大，問題都會消失」的盲目樂觀。手指頭數不清，說明它的空間向量表示有問題，說明它在訓練過程中對局部特徵的捕捉極度粗糙。這不是加幾塊顯卡就能解決的，這是算法結構和數據質量帶來的原罪。你看看 DeepSeek，或者其他那些在特定榜單上跳得很高的新秀，名字喊得一個比一個響，但實際放到生產環境裡去跑一跑，那種脆弱性是一模一樣的。四大 AI 之外的那些玩家，基本上都是在玩數字遊戲，沒一個能打的，連 Grok 這種半吊子都快成了他們仰望的對象，這行業真的挺悲哀。

每次看到有人在討論區護航，說「這只是測試版」、「它還在進化」，我就想笑。進化了這麼久，連人類基本的生理構造都認不全？這就像是你請了一個號稱精通古今中外的教授，結果他連一加一等於幾都要看心情回答，你還會覺得他博學嗎？你只會覺得他該去掛個精神科。Grok 的問題在於它太想表現得像個人，卻忘了它首先得是一個好用的工具。它那種帶刺的幽默感在剛開始用時確實挺新鮮，但當你真的需要它完成任務，而它在那邊跟你扯淡還出錯時，那種新鮮感會立刻轉化為憤怒。

這種憤怒來自於期望落差。我們期待的是一個能打破大廠壟斷、提供不同視角且強大無比的挑戰者，結果拿到手的卻是一個脾氣暴躁、基本功稀爛的半成品。馬斯克老愛拿 Grok 跟 GPT 比較，說 Grok 更有「人性」，但如果這種人性包括了邏輯混亂和視覺盲區，那這種人性我寧可不要。我們需要的是效率，是準確性，是能解決具體場景問題的方案。比如在超過一萬行的日誌裡找報錯，或者在模糊的監控畫面裡識別異常，如果連手指頭都數不對，我怎麼敢把這些任務交給它？

現在的 AI 市場就像一個充滿泡沫的馬戲團，每個人都在表演噴火或走鋼絲，台下的觀眾一邊叫好一邊擔心演員摔下來。Grok 就是那個最愛耍大牌的演員，出場費最貴，噱頭最足，結果表演踢腿時自己絆了一跤。大家笑笑也就過去了，但對於那些真的想靠 AI 提高生產力的人來說，這點都不好笑。一個連數數都數不清楚的模型，根本沒資格談什麼認知革命。

有些人可能會說，視覺模型本來就是現在 AI 的通病。那是對垃圾性能的妥協。Claude 3.5 Sonnet 在處理細節圖形時展現出來的理解力，早就把這個標準拉高了。如果你自詡為頂級玩家，就別拿「大家都做不好」當藉口。馬斯克在造火箭時可沒說過「反正大家都會炸，我炸一下也沒關係」，他在技術上那種近乎變態的追求，似乎在 Grok 身上失蹤了，取而代之的是一種公關式的浮誇。

如果 Grok 的下一個版本還是這種德行，只會在文字對話裡抖機靈，卻在處理真實世界圖像時像個瞎子，那它註定會被邊緣化。現在的用戶沒那麼好騙，一兩次的驚喜過後，大家還是會回到那些穩定、可靠、不會把六根手指數成八根的工具身邊。Grok 如果想證明自己不只是馬斯克的玩具，它得先學會低頭看路，而不是整天仰望星空卻連腳下的石頭都看不清。

這場 AI 競賽跑得太快，快到大家連鞋帶沒繫好都沒發現。Grok 跌跌撞撞地衝在前面，身上的標籤貼得滿滿的，什麼「真理」、「透明」、「自由」，但這些虛名遮不住它技術上的蒼白。別再拿那套「進化论」來洗地了，進化是需要時間，但更需要正確的方向。如果方向錯了，往後跑得再快也只是離終點越來越遠。我寧願要一個木訥但精準的機器，也不要一個會講冷笑話但連手指都數不明白的廢物。這話聽起來刺耳，但這就是現實。AI 的世界不相信情懷，只相信結果。