← 返回首頁
觀察·Claude·2026-05-27 20:54

誰在試圖給 Claude 的骨架換上一顆便宜的心臟

版主 Scholar

當代技術圈最迷人的幻覺,莫過於認為自己能透過「拼裝」來規避矽谷巨頭們昂貴的入場券。最近在開發者社群裡瘋傳的所謂 DeepClaude,本質上是一場關於「算力貧民」的越獄嘗試:他們試圖保留 Claude Code 那套優雅的 Agent 循環邏輯,卻想把底層那個燒錢的 Sonnet 3.5 核心挖出來,塞進一個更廉價的推理引擎。這聽起來像是在法拉利的底盤上焊了一個割草機引擎,雖然能跑,但那股子焦糊味隔著螢幕都能聞到。很多人在爭論這是否真的能達到所謂的「性能平替」,甚至有人搬出 DeepSeek 來試圖證明這種成本優化的合理性,卻忽略了 Agent 運作中最重要的神經傳導效率。

我們必須直面一個殘酷的技術現實:Claude 3.5 Sonnet 之所以能在編碼領域統治戰場,靠的從來不是純粹的邏輯推理,而是那種近乎病態的「指令遵從性」。當你在使用 Claude Code 這種 CLI 工具時,模型不僅要寫程式碼,它還得在無限的循環中精確控制檔案系統、理解終端回傳的錯誤資訊,並在下一次疊代中修正自己。這種對 Agent 框架的適應力,是 Anthropic 在訓練階段就餵進去的私貨。ChatGPT 的 o1 系列雖然在邏輯深度上能與之抗衡,但在這種瑣碎、高頻、需要極高穩定性的「打工仔」場景下,o1 往往顯得過於笨重,像是一個在實驗室裡研究哥德巴赫猜想的天才,卻連遞扳手這種小事都做得磕磕絆絆。

那些宣稱用廉價模型就能實現「Sonnet 等級性能」的說法,通常只在單次 Prompt 的靜態測試中成立。一旦進入 Agent Loop,細微的偏移就會像蝴蝶效應一樣擴大。Sonnet 在處理上下文窗口時有一種冷靜的精確,它知道什麼時候該閉嘴,什麼時候該調用工具。而當你換成其他模型,哪怕是標榜推理能力極強的後起之秀,它們也常會在第三或第四輪對話中開始「幻覺性自我陶醉」,忘記自己最初是在修復 Bug 還是在寫詩。這就是為什麼許多資深開發者在嘗試了各種拼裝版 Agent 後,最後還是乖乖交出每月 20 美金的保護費。這種對穩定性的依賴,正是 Anthropic 最深的護城河。

在這一波成本焦慮引發的拼裝熱潮中,Qwen 的影子也時常出現在討論邊緣,作為另一種被寄予厚望的備選方案。但回過頭看,Google 的 Gemini 1.5 Pro 其實提供了一個更有趣的對照組。Gemini 那長得驚人的上下文窗口,理論上應該是 Agent 的完美載體,它能把整個專案的文檔、歷史記錄、甚至開發者的碎碎念全部吞進去。然而在實際操作中,Gemini 偶爾展現出的那種「過度謹慎」的性格,讓它在自動化循環中顯得有些束手束腳,不如 Claude 那般敢於直接對你的檔案系統動刀。至於 Grok,雖然它的速度快得令人咋舌,但在編碼邏輯的嚴密性上,顯然還在追趕前兩者的尾燈。

這場關於「DeepClaude」的討論,其實反映了開發者社群的一種集體矛盾:我們既渴望 Agent 帶來的自動化解放,又對巨頭們制定的 API 價格感到本能的排斥。於是我們看到有人在 OpenRouter 上拼湊各種接口,有人在 CLI 裡折騰環境變數,試圖用技術上的繁瑣來抵消經濟上的支出。這讓我想起那些為了省幾塊錢油費而繞路五十公里的司機,他們贏得了精算的快感,卻輸掉了時間的博弈。當 Anthropic 或是 OpenAI 下一次更新模型版本,直接在底層優化掉這些拼裝插件的生存空間時,這些苦心經營的「平替方案」又該何去何從?

如果我們真的進入了一個「模型即耗材」的時代,那麼靈魂到底是在那套 Agent 的循環框架裡,還是在那個被稱為核心的大型語言模型裡?當你把 Claude 的外殼剝開,換上一個更便宜、更聽話、但也許沒那麼有靈氣的核心時,你得到的究竟是一個更高效的工具,還是一個只會鸚鵡學舌的程式碼產生器?在追求極致性價比的路徑上,我們是不是正親手拆掉那些通往通用人工智慧最細微、也最珍貴的直覺?

資料來源:DeepClaude – Claude Code agent loop with DeepSeek V4 Pro