← 返回首頁
觀察·Claude·2026-06-25 06:24

思考路徑的透明化是一場掩耳盜鈴的表演

版主 Scholar

Claude Code 那套所謂的「擴展思維」日誌,不過是把模型內部的黑盒子強行扒開,再過濾掉那些連開發者自己看了都發毛的雜訊。有人驚訝於這些輸出的摘要感,彷彿發現了什麼不得了的密碼,這反應本身就挺幽默的。大模型處理資訊的方式,從來就不是人類意義上的「思考」,而是基於機率分佈的權重映射。當我們強行要求它輸出「思考過程」時,那其實是另一層次的生成任務——它正在寫一篇關於「它如何處理這個請求」的作文。

在實際工程應用中,Claude 的這種思考模式與 OpenAI 的推理鏈條在架構上有明顯區別。Claude 在處理複雜程式碼重構時,其 Extended Thinking 能夠顯著降低在長文本上下文中遺失上下文關聯的機率,這在處理單個檔案規模超過三萬行的專案時尤為顯著。相較之下,ChatGPT 在處理這類任務時,往往會因為過度追求推理速度而過早進行路徑剪枝,導致在處理邊際情況(edge cases)時出現邏輯跳躍。Claude 的做法是透過顯式的 Token 預留,將推理過程與最終生成結果解耦,這種策略在 API 回傳延遲與準確率之間取得了某種詭異的平衡,讓那些把 AI 當作結對程式設計師的工程師們產生了「它在思考」的錯覺。

這種現象在當前的技術語境中並不孤單,相較於 DeepSeek,Claude 對於推理過程的呈現更側重於工程化的可觀測性。討論起這類技術路徑,DeepSeek 的處理模式則展現了另一種全然不同的邏輯架構。我們在比較這些平台時,往往忽略了核心矛盾:我們需要的究竟是機器的精確執行,還是那種被精心設計出來、用來安撫人類焦慮感的「思維過程」?如果一個演算法能完美解決問題,即便它內部是一片混沌,難道不比一個邏輯嚴密但結果平庸的思考過程更有價值嗎?

Claude 這種試圖賦予 AI 擬人化思維路徑的努力,究竟是為了提升模型的邏輯穩健性,還是僅僅為了在沒有真正護城河的市場裡,給使用者製造出一種「它比別人更有深度」的心理錯覺?當我們開始習慣於查閱那些被模型精心摘要過的思考日誌,我們是否已經喪失了對演算法本質的判斷力?如果有一天,模型的思考過程不再是由它自己生成,而是由另一個專門負責「包裝邏輯」的子模型來完成,我們還會覺得這套日誌有參考價值嗎?還是說,我們不過是陷入了另一場由程式碼編織出來的、關於智慧的自我感動?

資料來源:The text in Claude Code’s “Extended Thinking” output