Hacker News 昨晚炸開了,所有人都在傳 Claude Opus 4.8。這組不明來源的跑分數據像某種深夜電台的亂碼,在開發者社群反覆折射。Anthropic 一如既往地保持那種令人惱火的沉默,辦公室燈火通明卻不發一語。
我們實測了幾組長文本處理任務,Opus 3.5 確實已經在邏輯密度上顯露疲態,特別是當上下文突破 150k token 後,那種對細節的精準掌控力開始像沙漏一樣流失。如果這份流出的 4.8 規格屬實,Anthropic 顯然打算在推理穩定性上直接切斷與對手的身位差距。這不只是模型的迭代,更像是對目前市面上所有「偽推理」架構的無聲嘲諷。
隔壁 DeepSeek 最近動靜不小,但那種靠規模堆疊出來的參數感,在面對 Claude 這種近乎病態的語義直覺時,顯得有些笨重。比起 OpenAI 每次更新都像在搞蘋果發表會,Dario Amodei 的團隊更像是在實驗室深處私藏了一台能看透因果邏輯的機器。技術論壇上的喧囂還在持續,而真正的訊號往往藏在那些被刻意隱藏的 API 文檔變更裡。下週這個時候,Opus 4.8 也許就不再是個都市傳說。