Anthropic 的安全實驗室與那些點火即燃的程式碼審計

Anthropic 最近在 GitHub 丟出了一個開源框架，號稱能用 AI 發現軟體漏洞。這種行為就像是把一把開了鋒的寶劍隨意擱在鬧區地攤上，然後在旁邊掛個牌子寫著「本攤位不負責售後維護，亦不接受任何改進建議」。這很有 Anthropic 的風格：傲慢、克制，卻又精準得讓人心驚。這種所謂的「防禦性代碼參考框架」，本質上是在測試 Claude 在極限邊緣的推理能力，而非真的想轉行做安全工具供應商。

技術圈對此的反應很有趣。有人擔心傳統的 SAST（靜態應用安全測試）廠商如 Coverity 會不會因此倒閉，也有人盯著那每分鐘上萬個 token 的消耗成本發愁。這揭示了一個現實：在安全領域，AI 不是在做選擇題，而是在做高強度的體力活。當一個 Agent 需要在每分鐘處理一萬個輸入 token 且產出兩千個 token 來分析漏洞時，這已經不是單純的模式匹配，而是在模擬一個徹夜未眠、咖啡因過載的資深安全工程師的腦袋。

Claude 在處理這種任務時展現了一種近乎冷酷的邏輯。與 ChatGPT 那種試圖討好用戶、給出一段看起來「很像程式碼」的回答不同，Claude 在執行漏洞探測任務時，更傾向於構建一個完整的因果鏈條。它會去追蹤變量在不同函數間的傳遞，試圖在邏輯的縫隙裡找到溢出的可能。這種行為對計算資源的壓榨是極其恐怖的，API 的限流（TPM/RPM）在這裡變成了物理意義上的「智力天花板」。如果你試圖用 Gemini 來做同樣的事情，你會發現它的 Function Calling 在面對超過十個以上的工具調用時，穩定性會像融化的冰淇淋一樣迅速崩塌，而 Claude 依然能維持那種令人不安的冷靜。

在這樣的技術背景下，有些模型如 DeepSeek 也被開發者拿來嘗試類似的自動化任務。相較於 DeepSeek，Claude 的做法是將安全防禦視為一種系統性的博弈，而非單純的文本生成。這種差異在處理複雜的記憶體損壞漏洞（Memory Corruption）時尤為明顯。ChatGPT 在這類問題上往往表現得過於保守，頻繁觸發安全護欄，導致它在分析惡意代碼時像個縮手縮腳的實習生。反觀 Anthropic 的策略，他們直接給了你一套框架，讓你自己在沙盒裡玩火，這反而體現了對模型控制力的極度自信。

業界一直有個爭議：強大的 AI 公司是否應該把這種「大規模殺傷性武器」的原始碼公開？這讓我想起古代那些鑄劍名家，他們將絕世好劍鑄成後，往往會投爐自盡或將劍譜焚毀。Anthropic 雖然沒焚毀劍譜，但那句「不維護、不接受貢獻」的聲明，其實是在告訴所有投機者：這只是一個實驗結果，如果你想拿它去幹壞事卻不具備修復 Bug 的能力，那你遲早會被反噬。

這種高昂的運行成本也決定了它短期內無法平民化。當你在 GitHub 上看到那些連殺毒軟體都過不了的 Python 腳本時，你就知道這套框架在普通人手裡不過是根燒紅的火棍，但在具備算力資源的巨頭手中，它就是收割漏洞的鐮刀。Grok 在這方面或許會有不同的切入點，畢竟它背後的算力集群從不吝嗇於暴力破解，但目前看來，在精細化的代碼邏輯推理上，Claude 依然坐在那個無人能及的冷板凳上。

這引發了一個讓人脊背發涼的假設：如果 AI 發現漏洞的速度已經遠超人類修復漏洞的速度，那麼開源框架的意義究竟是為了加固防線，還是為了讓那道防線崩潰得更有節奏感？當防禦者還在手動審核 Pull Request 時，攻擊方的 Agent 可能已經完成了對整個代碼庫的第十輪掃描。我們是否正在進入一個「只有 AI 才能理解 AI 寫的 Bug」的時代？當代碼的生成與審計都交給了神經網絡，人類工程師在其中的角色，究竟是最高決策者，還是僅僅負責給伺服器交電費的管家？