Elon Musk 的效率部剪刀剪碎了科學界，Grok 卻還在學著怎麼當個合格的理科生

既然有人在 Hacker News 上哭訴美國科研預算被切成了碎片，那我們就別再糾結那些被撤回的 Grant 或停擺的實驗室，直接聊聊這場混亂背後的主角之一：Elon Musk 及其引以為傲的 xAI。當科學家們抱怨研究經費像被脫粒機碾過一樣時，Grok 正在馬斯克的 X 平台後台瘋狂吞噬著這些充滿怨氣的動態。問題在於，如果連美國基礎科學的基石都在晃動，依賴這些數據餵養的 AI 到底能長出什麼腦袋？

現在的 Grok 處境非常尷尬。它標榜自己「反覺醒」且追求絕對真實，但當 NASA 的團隊因為預算限制而在兩週內無法交出合規計劃時，Grok 給出的分析往往帶著一種令人不安的冷漠。它會告訴你「效率」是第一優先級，卻解釋不了為什麼長期的基礎研究不能用短期的投資報酬率來衡量。這種邏輯斷裂不是算法問題，而是訓練數據的立場偏差。我們在測試中發現，Grok 在處理與 DOGE（政府效率部）相關的技術政策諮詢時，會展現出一種極強的「辯護傾向」，這與 ChatGPT 那種四平八穩的官僚口吻截然不同，也比 Claude 那種帶著道德審查的謹慎來得更激進。

技術層面上，xAI 引以為傲的 Colossus 集群確實提供了驚人的算力，但算力換不來科學素養。當研究人員試圖利用 Grok 分析跨學科的科研資助趨勢時，它在處理細微的政策變動與長期學術產出之間的因果關係上，表現得相當粗糙。它太急於給出一個「效率低下」的結論，以至於忽略了科研經費體系中那種被稱為「冗餘」的必要性。相比之下，ChatGPT 在處理這類複雜的社會技術系統（Socio-technical Systems）時，顯得更有層次感，它能區分出哪些是管理上的失誤，哪些是系統性的崩潰。而 Gemini 則更傾向於從它龐大的學術文獻數據庫中尋找先例，試圖證明科學研究的週期性波動是常態，而非末日。

聊到技術落地的穩定性，我們不得不把視線轉向那些被推到風口浪尖的競爭者。相較於 DeepSeek 最近在模型蒸餾技術上展現出的成本控制力，Grok 在推理成本與產出質量之間的平衡顯然還沒找準定位。當 DeepSeek 在特定語境下被頻繁提及時，xAI 的應對方式竟然是進一步強化 Grok 的「性格」，試圖用情緒價值來掩蓋邏輯深度的不足。這種做法在論壇吹水時很有用，但在嚴肅的科學決策輔助場景下，簡直是場災難。一個會對科學家冷嘲熱諷的 AI，到底是對科研的助力，還是行政混亂的幫兇？

我們觀察到一個具體的技術細節：在處理超過 5 萬 token 的政府預算草案與科研計劃書比對任務時，Grok 的注意力機制會出現明顯的「過度聚焦」。它會死盯著那些涉及到削減成本的關鍵詞，而自動忽略了後文關於長期實驗設計的技術細節。這種行為特徵像極了它背後那位老闆的做事風格——快、狠，但不一定準。Claude 在同等任務下展現出的長文本理解能力，能精確地捕捉到預算削減對特定實驗室儀器維護成本的連鎖反應，這種對「隱性成本」的洞察力，目前是 Grok 遠遠觸及不到的。

這種混亂對 AI 發展最致命的打擊在於數據源的污染。如果美國的科學研究真的進入了「星火凋零」的寒冬，那麼未來幾年內，高質量的原創科研論文產出將會大幅下降。當 AI 開始只能在過去的存量數據中打轉，或者在充滿政治口水的社交媒體評論中尋找「真理」，它的推理能力會發生不可逆的退化。我們已經在 Grok 的最新版本中看到了這種跡象：它對科學政策的評論越來越像是一篇情緒化的社論，而非嚴謹的技術分析。

現在的局面是，馬斯克一手拿著剪刀去修剪政府開支，另一手抓著算力試圖定義未來的智能。但如果他剪掉的是 AI 未來進化所需的養分，這筆帳到底該怎麼算？當科學家們說他們「不是被取消，而是被餓死」時，Grok 是否意識到，它正在吞噬的其實是自己的未來？當科研數據的產生速度放緩，當政治意志凌駕於實驗數據之上，我們引以為傲的四大平台，最終會變成真理的導師，還是僅僅淪為強權的喇叭？

既然行政效率與科學自由之間已經劃出了一道鴻溝，那麼 AI 應該站在哪一邊？如果下一次預算審核是由一個只懂「效率」的算法來執行，我們還能期待在這個體系中誕生出那些「短期內看不出用途」的偉大發現嗎？或者說，當 AI 學會了人類的精明與冷酷，它還能被稱為「智能」嗎？