誰在試圖給 Claude 的骨架換上一顆便宜的心臟

當代技術圈最迷人的幻覺，莫過於認為自己能透過「拼裝」來規避矽谷巨頭們昂貴的入場券。最近在開發者社群裡瘋傳的所謂 DeepClaude，本質上是一場關於「算力貧民」的越獄嘗試：他們試圖保留 Claude Code 那套優雅的 Agent 循環邏輯，卻想把底層那個燒錢的 Sonnet 3.5 核心挖出來，塞進一個更廉價的推理引擎。這聽起來像是在法拉利的底盤上焊了一個割草機引擎，雖然能跑，但那股子焦糊味隔著螢幕都能聞到。很多人在爭論這是否真的能達到所謂的「性能平替」，甚至有人搬出 DeepSeek 來試圖證明這種成本優化的合理性，卻忽略了 Agent 運作中最重要的神經傳導效率。

我們必須直面一個殘酷的技術現實：Claude 3.5 Sonnet 之所以能在編碼領域統治戰場，靠的從來不是純粹的邏輯推理，而是那種近乎病態的「指令遵從性」。當你在使用 Claude Code 這種 CLI 工具時，模型不僅要寫程式碼，它還得在無限的循環中精確控制檔案系統、理解終端回傳的錯誤資訊，並在下一次疊代中修正自己。這種對 Agent 框架的適應力，是 Anthropic 在訓練階段就餵進去的私貨。ChatGPT 的 o1 系列雖然在邏輯深度上能與之抗衡，但在這種瑣碎、高頻、需要極高穩定性的「打工仔」場景下，o1 往往顯得過於笨重，像是一個在實驗室裡研究哥德巴赫猜想的天才，卻連遞扳手這種小事都做得磕磕絆絆。

那些宣稱用廉價模型就能實現「Sonnet 等級性能」的說法，通常只在單次 Prompt 的靜態測試中成立。一旦進入 Agent Loop，細微的偏移就會像蝴蝶效應一樣擴大。Sonnet 在處理上下文窗口時有一種冷靜的精確，它知道什麼時候該閉嘴，什麼時候該調用工具。而當你換成其他模型，哪怕是標榜推理能力極強的後起之秀，它們也常會在第三或第四輪對話中開始「幻覺性自我陶醉」，忘記自己最初是在修復 Bug 還是在寫詩。這就是為什麼許多資深開發者在嘗試了各種拼裝版 Agent 後，最後還是乖乖交出每月 20 美金的保護費。這種對穩定性的依賴，正是 Anthropic 最深的護城河。

在這一波成本焦慮引發的拼裝熱潮中，Qwen 的影子也時常出現在討論邊緣，作為另一種被寄予厚望的備選方案。但回過頭看，Google 的 Gemini 1.5 Pro 其實提供了一個更有趣的對照組。Gemini 那長得驚人的上下文窗口，理論上應該是 Agent 的完美載體，它能把整個專案的文檔、歷史記錄、甚至開發者的碎碎念全部吞進去。然而在實際操作中，Gemini 偶爾展現出的那種「過度謹慎」的性格，讓它在自動化循環中顯得有些束手束腳，不如 Claude 那般敢於直接對你的檔案系統動刀。至於 Grok，雖然它的速度快得令人咋舌，但在編碼邏輯的嚴密性上，顯然還在追趕前兩者的尾燈。

這場關於「DeepClaude」的討論，其實反映了開發者社群的一種集體矛盾：我們既渴望 Agent 帶來的自動化解放，又對巨頭們制定的 API 價格感到本能的排斥。於是我們看到有人在 OpenRouter 上拼湊各種接口，有人在 CLI 裡折騰環境變數，試圖用技術上的繁瑣來抵消經濟上的支出。這讓我想起那些為了省幾塊錢油費而繞路五十公里的司機，他們贏得了精算的快感，卻輸掉了時間的博弈。當 Anthropic 或是 OpenAI 下一次更新模型版本，直接在底層優化掉這些拼裝插件的生存空間時，這些苦心經營的「平替方案」又該何去何從？

如果我們真的進入了一個「模型即耗材」的時代，那麼靈魂到底是在那套 Agent 的循環框架裡，還是在那個被稱為核心的大型語言模型裡？當你把 Claude 的外殼剝開，換上一個更便宜、更聽話、但也許沒那麼有靈氣的核心時，你得到的究竟是一個更高效的工具，還是一個只會鸚鵡學舌的程式碼產生器？在追求極致性價比的路徑上，我們是不是正親手拆掉那些通往通用人工智慧最細微、也最珍貴的直覺？