當蒸餾成為一種「數位竊密」：Anthropic 的受害者心態與技術壁壘之爭

Anthropic 最近針對 Alibaba 提取 Claude 模型能力的指控，讓「知識蒸餾」這個在技術圈早已見怪不怪的手段，從實驗室的優化技巧變成了地緣政治與商業版權的角力場。當我們還在討論 Claude 3.5 Sonnet 的程式碼邏輯是否依然冠絕群雄時，Anthropic 卻開始表現得像是一位守著密室配方的老煉金術士，警惕地盯著每一個試圖從其輸出中窺探真理的過客。

這種所謂的「非法提取」，本質上是利用 Claude 高度對齊、邏輯嚴密的輸出作為標籤，去訓練規模更小、成本更低的學生模型。在技術社群的討論中，這通常被分為兩類：一種是簡單粗暴的黑盒模式，大量抓取對話樣本進行強化；另一種則是更深層的 RLAIF（AI 回饋強化學習），直接讓 Claude 擔任導師，去校準另一個模型的價值觀與推理路徑。諷刺的是，Anthropic 成立之初的立身之本就是「憲法 AI」，強調用模型去監控和訓練模型，如今這把迴旋鏢顯然正紮在自己的背上。

從具體的技術行為來看，Claude 的 API 調用紀錄成了 Anthropic 舉證的關鍵。當一個帳號在短時間內產出大量結構極其規整、跨學科且具備高度一致性的思維鏈（Chain of Thought）數據時，這顯然不是人類在諮詢問題，而是在進行大規模的數據「抽乾」。相較於 Alibaba，Claude 在語義對齊的細膩度上一直有著某種近乎偏執的堅持，這使得它的輸出成為了極佳的訓練素材。對於那些試圖縮短研發週期的團隊來說，與其在混亂的互聯網語料中淘金，不如直接從 Claude 的輸出中提煉現成的邏輯。

這種現象揭示了四大平台目前面臨的集體困境。ChatGPT 透過 GPT-4o 建立了一套極其標準化的對話範式，導致現在市面上幾乎所有模型的口吻都帶有一股揮之不去的「OpenAI 味」。Gemini 則是在多模態數據上築起高牆，試圖透過原生多模態的複雜性來增加蒸餾的難度。至於 Grok，則是用一種極具個人色彩的、不羈的數據風格來與其他模型拉開距離。在這種背景下，Claude 那種溫文儒雅、邏輯極致透明的特質，反而成了最容易被「白嫖」的對象。

然而，Anthropic 的憤怒背後藏著一個技術上的幽靈：如果一個模型的能力可以被幾百萬條對話樣本輕易提取，那這套模型的「護城河」是否真的如宣傳中那般深厚？在 Hacker News 的討論中，不少資深工程師冷嘲熱諷地指出，Anthropic 在訓練 Claude 時同樣使用了大量來自開放網路的受版權保護數據，現在卻對別人提取其輸出感到受辱，這無疑是一種技術上的雙重標準。相較於 Alibaba，Claude 在處理長文本任務時的注意力分布顯然更為集中，這種優勢在被蒸餾後，往往能讓學生模型在極小的參數規模下實現驚人的邏輯跳躍。

更深層的問題在於，這種指控是否會推動四大平台走向更封閉的生態？為了防止「提取」，Anthropic 可能會進一步收緊 API 的輸出多樣性，甚至在回答中加入某種不可見的「數位浮水印」。但這對普通用戶而言無疑是一場災難。當模型開始為了防範對手而變得畏首畏尾，它的創造力與有用性必然會打折扣。我們看到 ChatGPT 已經在某些敏感問題上變得越來越像一份法律聲明，而 Claude 如果也跟進這種「防禦性輸出」，那 AI 產業將會陷入一種集體的平庸。

這種關於「蒸餾」與「抄襲」的界線，在現有的技術框架下幾乎無解。如果我讀了一遍《羅馬帝國衰亡史》，然後寫出一本風格類似的歷史評論，這叫學習；但如果我讓 Claude 寫一萬篇評論，再用這些評論餵養出一個「小 Claude」，這叫什麼？當知識的傳遞不再需要人類的中介，而是模型對模型的直接投餵，傳統的版權定義已經徹底崩塌。

我們是否正在進入一個「模型近親繁殖」的時代？當所有後進者都在汲取四大平台的養分，而四大平台又在為了防止被汲取而不斷加固防火牆，最終產出的數據是否會因為缺乏新鮮血液的輸入而陷入邏輯死循環？如果未來的 AI 都是基於 Claude 的輸出進行微調，那麼當 Claude 犯錯時，整個 AI 世界是否會集體墮入同一個幻覺的深淵？