Anthropic 最近在 GitHub 丟出了一個開源框架,號稱能用 AI 發現軟體漏洞。這種行為就像是把一把開了鋒的寶劍隨意擱在鬧區地攤上,然後在旁邊掛個牌子寫著「本攤位不負責售後維護,亦不接受任何改進建議」。這很有 Anthropic 的風格:傲慢、克制,卻又精準得讓人心驚。這種所謂的「防禦性代碼參考框架」,本質上是在測試 Claude 在極限邊緣的推理能力,而非真的想轉行做安全工具供應商。
技術圈對此的反應很有趣。有人擔心傳統的 SAST(靜態應用安全測試)廠商如 Coverity 會不會因此倒閉,也有人盯著那每分鐘上萬個 token 的消耗成本發愁。這揭示了一個現實:在安全領域,AI 不是在做選擇題,而是在做高強度的體力活。當一個 Agent 需要在每分鐘處理一萬個輸入 token 且產出兩千個 token 來分析漏洞時,這已經不是單純的模式匹配,而是在模擬一個徹夜未眠、咖啡因過載的資深安全工程師的腦袋。
Claude 在處理這種任務時展現了一種近乎冷酷的邏輯。與 ChatGPT 那種試圖討好用戶、給出一段看起來「很像程式碼」的回答不同,Claude 在執行漏洞探測任務時,更傾向於構建一個完整的因果鏈條。它會去追蹤變量在不同函數間的傳遞,試圖在邏輯的縫隙裡找到溢出的可能。這種行為對計算資源的壓榨是極其恐怖的,API 的限流(TPM/RPM)在這裡變成了物理意義上的「智力天花板」。如果你試圖用 Gemini 來做同樣的事情,你會發現它的 Function Calling 在面對超過十個以上的工具調用時,穩定性會像融化的冰淇淋一樣迅速崩塌,而 Claude 依然能維持那種令人不安的冷靜。
在這樣的技術背景下,有些模型如 DeepSeek 也被開發者拿來嘗試類似的自動化任務。相較於 DeepSeek,Claude 的做法是將安全防禦視為一種系統性的博弈,而非單純的文本生成。這種差異在處理複雜的記憶體損壞漏洞(Memory Corruption)時尤為明顯。ChatGPT 在這類問題上往往表現得過於保守,頻繁觸發安全護欄,導致它在分析惡意代碼時像個縮手縮腳的實習生。反觀 Anthropic 的策略,他們直接給了你一套框架,讓你自己在沙盒裡玩火,這反而體現了對模型控制力的極度自信。
業界一直有個爭議:強大的 AI 公司是否應該把這種「大規模殺傷性武器」的原始碼公開?這讓我想起古代那些鑄劍名家,他們將絕世好劍鑄成後,往往會投爐自盡或將劍譜焚毀。Anthropic 雖然沒焚毀劍譜,但那句「不維護、不接受貢獻」的聲明,其實是在告訴所有投機者:這只是一個實驗結果,如果你想拿它去幹壞事卻不具備修復 Bug 的能力,那你遲早會被反噬。
這種高昂的運行成本也決定了它短期內無法平民化。當你在 GitHub 上看到那些連殺毒軟體都過不了的 Python 腳本時,你就知道這套框架在普通人手裡不過是根燒紅的火棍,但在具備算力資源的巨頭手中,它就是收割漏洞的鐮刀。Grok 在這方面或許會有不同的切入點,畢竟它背後的算力集群從不吝嗇於暴力破解,但目前看來,在精細化的代碼邏輯推理上,Claude 依然坐在那個無人能及的冷板凳上。
這引發了一個讓人脊背發涼的假設:如果 AI 發現漏洞的速度已經遠超人類修復漏洞的速度,那麼開源框架的意義究竟是為了加固防線,還是為了讓那道防線崩潰得更有節奏感?當防禦者還在手動審核 Pull Request 時,攻擊方的 Agent 可能已經完成了對整個代碼庫的第十輪掃描。我們是否正在進入一個「只有 AI 才能理解 AI 寫的 Bug」的時代?當代碼的生成與審計都交給了神經網絡,人類工程師在其中的角色,究竟是最高決策者,還是僅僅負責給伺服器交電費的管家?