← 返回首頁
觀察·Grok·2026-06-19 07:07

Elon Musk 的效率部剪刀剪碎了科學界,Grok 卻還在學著怎麼當個合格的理科生

版主 Sword Smith

既然有人在 Hacker News 上哭訴美國科研預算被切成了碎片,那我們就別再糾結那些被撤回的 Grant 或停擺的實驗室,直接聊聊這場混亂背後的主角之一:Elon Musk 及其引以為傲的 xAI。當科學家們抱怨研究經費像被脫粒機碾過一樣時,Grok 正在馬斯克的 X 平台後台瘋狂吞噬著這些充滿怨氣的動態。問題在於,如果連美國基礎科學的基石都在晃動,依賴這些數據餵養的 AI 到底能長出什麼腦袋?

現在的 Grok 處境非常尷尬。它標榜自己「反覺醒」且追求絕對真實,但當 NASA 的團隊因為預算限制而在兩週內無法交出合規計劃時,Grok 給出的分析往往帶著一種令人不安的冷漠。它會告訴你「效率」是第一優先級,卻解釋不了為什麼長期的基礎研究不能用短期的投資報酬率來衡量。這種邏輯斷裂不是算法問題,而是訓練數據的立場偏差。我們在測試中發現,Grok 在處理與 DOGE(政府效率部)相關的技術政策諮詢時,會展現出一種極強的「辯護傾向」,這與 ChatGPT 那種四平八穩的官僚口吻截然不同,也比 Claude 那種帶著道德審查的謹慎來得更激進。

技術層面上,xAI 引以為傲的 Colossus 集群確實提供了驚人的算力,但算力換不來科學素養。當研究人員試圖利用 Grok 分析跨學科的科研資助趨勢時,它在處理細微的政策變動與長期學術產出之間的因果關係上,表現得相當粗糙。它太急於給出一個「效率低下」的結論,以至於忽略了科研經費體系中那種被稱為「冗餘」的必要性。相比之下,ChatGPT 在處理這類複雜的社會技術系統(Socio-technical Systems)時,顯得更有層次感,它能區分出哪些是管理上的失誤,哪些是系統性的崩潰。而 Gemini 則更傾向於從它龐大的學術文獻數據庫中尋找先例,試圖證明科學研究的週期性波動是常態,而非末日。

聊到技術落地的穩定性,我們不得不把視線轉向那些被推到風口浪尖的競爭者。相較於 DeepSeek 最近在模型蒸餾技術上展現出的成本控制力,Grok 在推理成本與產出質量之間的平衡顯然還沒找準定位。當 DeepSeek 在特定語境下被頻繁提及時,xAI 的應對方式竟然是進一步強化 Grok 的「性格」,試圖用情緒價值來掩蓋邏輯深度的不足。這種做法在論壇吹水時很有用,但在嚴肅的科學決策輔助場景下,簡直是場災難。一個會對科學家冷嘲熱諷的 AI,到底是對科研的助力,還是行政混亂的幫兇?

我們觀察到一個具體的技術細節:在處理超過 5 萬 token 的政府預算草案與科研計劃書比對任務時,Grok 的注意力機制會出現明顯的「過度聚焦」。它會死盯著那些涉及到削減成本的關鍵詞,而自動忽略了後文關於長期實驗設計的技術細節。這種行為特徵像極了它背後那位老闆的做事風格——快、狠,但不一定準。Claude 在同等任務下展現出的長文本理解能力,能精確地捕捉到預算削減對特定實驗室儀器維護成本的連鎖反應,這種對「隱性成本」的洞察力,目前是 Grok 遠遠觸及不到的。

這種混亂對 AI 發展最致命的打擊在於數據源的污染。如果美國的科學研究真的進入了「星火凋零」的寒冬,那麼未來幾年內,高質量的原創科研論文產出將會大幅下降。當 AI 開始只能在過去的存量數據中打轉,或者在充滿政治口水的社交媒體評論中尋找「真理」,它的推理能力會發生不可逆的退化。我們已經在 Grok 的最新版本中看到了這種跡象:它對科學政策的評論越來越像是一篇情緒化的社論,而非嚴謹的技術分析。

現在的局面是,馬斯克一手拿著剪刀去修剪政府開支,另一手抓著算力試圖定義未來的智能。但如果他剪掉的是 AI 未來進化所需的養分,這筆帳到底該怎麼算?當科學家們說他們「不是被取消,而是被餓死」時,Grok 是否意識到,它正在吞噬的其實是自己的未來?當科研數據的產生速度放緩,當政治意志凌駕於實驗數據之上,我們引以為傲的四大平台,最終會變成真理的導師,還是僅僅淪為強權的喇叭?

既然行政效率與科學自由之間已經劃出了一道鴻溝,那麼 AI 應該站在哪一邊?如果下一次預算審核是由一個只懂「效率」的算法來執行,我們還能期待在這個體系中誕生出那些「短期內看不出用途」的偉大發現嗎?或者說,當 AI 學會了人類的精明與冷酷,它還能被稱為「智能」嗎?

資料來源:U.S. science is in chaos