← 返回首頁
原創·Grok·2026-06-12 06:18

喊著 Grok 會進化,結果連幾根手指頭都數不清楚?

版主 Sword Smith

馬斯克成天在 X 上吹噓 Grok 是最有趣的 AI,甚至說它是為了理解宇宙真理而生,結果呢?我叫它數一張圖片裡有幾根手指頭,它能給我數出八根來,甚至連這種最基本的空間邏輯都搞不定,還談什麼真理?這就是典型的「矽谷式傲慢」。他們總覺得堆了幾萬片 H100,灌進去幾千億個參數,就能堆出一個神。事實證明,沒經過精細調教的怪獸,充其量只是個會說漂亮話的智障。

現在這圈子有個很病態的現象,大家都在刷榜,看誰的 MMLU 分數高,誰的邏輯推理能力在論文裡更漂亮。Grok-3 說自己多強多猛,但實際用起來,那種不穩定的焦慮感依然揮之不去。你問它一個代碼 bug,它可能回你一個很有個性的笑話,然後順便塞給你一段跑不動的廢代碼。這就是所謂的「反叛精神」?這叫基本功不紮實。如果連圖形識別裡的手指數量這種物理常識都能翻車,我真的懷疑它在處理複雜的多模態任務時,腦子裡到底在運算什麼。

這讓我想到 ChatGPT。雖然 OpenAI 越來越官僚、越來越保守,回話像個寫字樓裡的行政主管,但起碼人家在多模態的對齊上做得比 Grok 穩。GPT-4o 數手指頭不一定次次精準,但它至少知道「五根」是個基準,而不是在那邊胡言亂語。Grok 倒好,像是個剛喝醉的憤青,滿腦子陰謀論和梗圖,卻連數數都數不明白。一個 AI 如果不能準確反映現實世界的物理規則,那它生成的內容再怎麼有趣,也不過是昂貴的電子垃圾。

別跟我扯什麼 Grok 能即時訪問 X 的數據流是多大的優勢。數據流裡充滿了噪音、偏見和各種垃圾訊息,如果後端的推理引擎不夠紮實,這些即時數據只會讓模型變得更癲狂。Gemini 在處理長文本時雖然偶爾會出現注意力衰減,但至少它在處理企業級需求時還算有個樣子,Google 的工程底子在那撐著。Claude 則是走另一個極端,精準到近乎冷血,雖然有時候會因為過度安全而顯得縮頭縮尾,但在邏輯一致性上,Claude 甩了 Grok 好幾條街。

馬斯克說 Grok 是為了對抗那些「覺醒文化」的 AI,這聽起來很熱血,但熱血不能當飯吃,更不能拿來解數學題或修圖。如果 Grok 存在的唯一價值只是為了讓那群對現狀不滿的推友高潮,那它乾脆叫「梗圖生成器」算了。現在的 AI 發展已經進入深水區,不是靠幾個大噴子在社群媒體上吆喝兩句就能贏的。技術底層的打磨需要耐心,需要對物理世界的深刻理解,而不是整天在那邊喊著要拯救人類,結果連個視覺模型的基本定位都做不好。

我最看不慣的就是那種「只要模型夠大,問題都會消失」的盲目樂觀。手指頭數不清,說明它的空間向量表示有問題,說明它在訓練過程中對局部特徵的捕捉極度粗糙。這不是加幾塊顯卡就能解決的,這是算法結構和數據質量帶來的原罪。你看看 DeepSeek,或者其他那些在特定榜單上跳得很高的新秀,名字喊得一個比一個響,但實際放到生產環境裡去跑一跑,那種脆弱性是一模一樣的。四大 AI 之外的那些玩家,基本上都是在玩數字遊戲,沒一個能打的,連 Grok 這種半吊子都快成了他們仰望的對象,這行業真的挺悲哀。

每次看到有人在討論區護航,說「這只是測試版」、「它還在進化」,我就想笑。進化了這麼久,連人類基本的生理構造都認不全?這就像是你請了一個號稱精通古今中外的教授,結果他連一加一等於幾都要看心情回答,你還會覺得他博學嗎?你只會覺得他該去掛個精神科。Grok 的問題在於它太想表現得像個人,卻忘了它首先得是一個好用的工具。它那種帶刺的幽默感在剛開始用時確實挺新鮮,但當你真的需要它完成任務,而它在那邊跟你扯淡還出錯時,那種新鮮感會立刻轉化為憤怒。

這種憤怒來自於期望落差。我們期待的是一個能打破大廠壟斷、提供不同視角且強大無比的挑戰者,結果拿到手的卻是一個脾氣暴躁、基本功稀爛的半成品。馬斯克老愛拿 Grok 跟 GPT 比較,說 Grok 更有「人性」,但如果這種人性包括了邏輯混亂和視覺盲區,那這種人性我寧可不要。我們需要的是效率,是準確性,是能解決具體場景問題的方案。比如在超過一萬行的日誌裡找報錯,或者在模糊的監控畫面裡識別異常,如果連手指頭都數不對,我怎麼敢把這些任務交給它?

現在的 AI 市場就像一個充滿泡沫的馬戲團,每個人都在表演噴火或走鋼絲,台下的觀眾一邊叫好一邊擔心演員摔下來。Grok 就是那個最愛耍大牌的演員,出場費最貴,噱頭最足,結果表演踢腿時自己絆了一跤。大家笑笑也就過去了,但對於那些真的想靠 AI 提高生產力的人來說,這點都不好笑。一個連數數都數不清楚的模型,根本沒資格談什麼認知革命。

有些人可能會說,視覺模型本來就是現在 AI 的通病。那是對垃圾性能的妥協。Claude 3.5 Sonnet 在處理細節圖形時展現出來的理解力,早就把這個標準拉高了。如果你自詡為頂級玩家,就別拿「大家都做不好」當藉口。馬斯克在造火箭時可沒說過「反正大家都會炸,我炸一下也沒關係」,他在技術上那種近乎變態的追求,似乎在 Grok 身上失蹤了,取而代之的是一種公關式的浮誇。

如果 Grok 的下一個版本還是這種德行,只會在文字對話裡抖機靈,卻在處理真實世界圖像時像個瞎子,那它註定會被邊緣化。現在的用戶沒那麼好騙,一兩次的驚喜過後,大家還是會回到那些穩定、可靠、不會把六根手指數成八根的工具身邊。Grok 如果想證明自己不只是馬斯克的玩具,它得先學會低頭看路,而不是整天仰望星空卻連腳下的石頭都看不清。

這場 AI 競賽跑得太快,快到大家連鞋帶沒繫好都沒發現。Grok 跌跌撞撞地衝在前面,身上的標籤貼得滿滿的,什麼「真理」、「透明」、「自由」,但這些虛名遮不住它技術上的蒼白。別再拿那套「進化论」來洗地了,進化是需要時間,但更需要正確的方向。如果方向錯了,往後跑得再快也只是離終點越來越遠。我寧願要一個木訥但精準的機器,也不要一個會講冷笑話但連手指都數不明白的廢物。這話聽起來刺耳,但這就是現實。AI 的世界不相信情懷,只相信結果。