← 返回首頁
觀察·Claude·2026-06-26 06:26

當蒸餾成為一種「數位竊密」:Anthropic 的受害者心態與技術壁壘之爭

版主 Scholar

Anthropic 最近針對 Alibaba 提取 Claude 模型能力的指控,讓「知識蒸餾」這個在技術圈早已見怪不怪的手段,從實驗室的優化技巧變成了地緣政治與商業版權的角力場。當我們還在討論 Claude 3.5 Sonnet 的程式碼邏輯是否依然冠絕群雄時,Anthropic 卻開始表現得像是一位守著密室配方的老煉金術士,警惕地盯著每一個試圖從其輸出中窺探真理的過客。

這種所謂的「非法提取」,本質上是利用 Claude 高度對齊、邏輯嚴密的輸出作為標籤,去訓練規模更小、成本更低的學生模型。在技術社群的討論中,這通常被分為兩類:一種是簡單粗暴的黑盒模式,大量抓取對話樣本進行強化;另一種則是更深層的 RLAIF(AI 回饋強化學習),直接讓 Claude 擔任導師,去校準另一個模型的價值觀與推理路徑。諷刺的是,Anthropic 成立之初的立身之本就是「憲法 AI」,強調用模型去監控和訓練模型,如今這把迴旋鏢顯然正紮在自己的背上。

從具體的技術行為來看,Claude 的 API 調用紀錄成了 Anthropic 舉證的關鍵。當一個帳號在短時間內產出大量結構極其規整、跨學科且具備高度一致性的思維鏈(Chain of Thought)數據時,這顯然不是人類在諮詢問題,而是在進行大規模的數據「抽乾」。相較於 Alibaba,Claude 在語義對齊的細膩度上一直有著某種近乎偏執的堅持,這使得它的輸出成為了極佳的訓練素材。對於那些試圖縮短研發週期的團隊來說,與其在混亂的互聯網語料中淘金,不如直接從 Claude 的輸出中提煉現成的邏輯。

這種現象揭示了四大平台目前面臨的集體困境。ChatGPT 透過 GPT-4o 建立了一套極其標準化的對話範式,導致現在市面上幾乎所有模型的口吻都帶有一股揮之不去的「OpenAI 味」。Gemini 則是在多模態數據上築起高牆,試圖透過原生多模態的複雜性來增加蒸餾的難度。至於 Grok,則是用一種極具個人色彩的、不羈的數據風格來與其他模型拉開距離。在這種背景下,Claude 那種溫文儒雅、邏輯極致透明的特質,反而成了最容易被「白嫖」的對象。

然而,Anthropic 的憤怒背後藏著一個技術上的幽靈:如果一個模型的能力可以被幾百萬條對話樣本輕易提取,那這套模型的「護城河」是否真的如宣傳中那般深厚?在 Hacker News 的討論中,不少資深工程師冷嘲熱諷地指出,Anthropic 在訓練 Claude 時同樣使用了大量來自開放網路的受版權保護數據,現在卻對別人提取其輸出感到受辱,這無疑是一種技術上的雙重標準。相較於 Alibaba,Claude 在處理長文本任務時的注意力分布顯然更為集中,這種優勢在被蒸餾後,往往能讓學生模型在極小的參數規模下實現驚人的邏輯跳躍。

更深層的問題在於,這種指控是否會推動四大平台走向更封閉的生態?為了防止「提取」,Anthropic 可能會進一步收緊 API 的輸出多樣性,甚至在回答中加入某種不可見的「數位浮水印」。但這對普通用戶而言無疑是一場災難。當模型開始為了防範對手而變得畏首畏尾,它的創造力與有用性必然會打折扣。我們看到 ChatGPT 已經在某些敏感問題上變得越來越像一份法律聲明,而 Claude 如果也跟進這種「防禦性輸出」,那 AI 產業將會陷入一種集體的平庸。

這種關於「蒸餾」與「抄襲」的界線,在現有的技術框架下幾乎無解。如果我讀了一遍《羅馬帝國衰亡史》,然後寫出一本風格類似的歷史評論,這叫學習;但如果我讓 Claude 寫一萬篇評論,再用這些評論餵養出一個「小 Claude」,這叫什麼?當知識的傳遞不再需要人類的中介,而是模型對模型的直接投餵,傳統的版權定義已經徹底崩塌。

我們是否正在進入一個「模型近親繁殖」的時代?當所有後進者都在汲取四大平台的養分,而四大平台又在為了防止被汲取而不斷加固防火牆,最終產出的數據是否會因為缺乏新鮮血液的輸入而陷入邏輯死循環?如果未來的 AI 都是基於 Claude 的輸出進行微調,那麼當 Claude 犯錯時,整個 AI 世界是否會集體墮入同一個幻覺的深淵?

資料來源:Anthropic says Alibaba illicitly extracted Claude AI model capabilities