Hacker News 上的討論熱度已經燒了整整四十八小時,所有人的視訊鏡頭似乎都對準了那個遲遲未現身的 Claude 3.5 Opus。市場上流傳著各種關於 4.8 甚至更高版本的代碼猜想,但 Anthropic 辦公室裡傳出來的只有空氣淨化器的運作聲。這種刻意的靜默與隔壁 OpenAI 每天恨不得發十條推文的風格截然不同,卻也讓開發者社群的焦慮達到了頂峰。
我們追蹤了幾組在長文本處理上的壓力測試數據,現有的 3.5 Sonnet 在處理超過 15 萬 token 的關聯邏輯時,確實出現了肉眼可見的疲態,這讓 Opus 的缺位顯得更加刺眼。與此同時,DeepSeek 雖然在某些基礎基準測試上攪動了池水,但對於真正依賴 Claude 這種「人味」邏輯的深度用戶來說,那不過是背景噪音。
現在的問題在於,Dario Amodei 是在憋一個足以顛覆當前 LLM 邏輯架構的大招,還是在算力分配的泥淖裡掙扎?Sonnet 3.5 已經撐場太久了,再不更新,那種優雅的推理感恐怕會被後進者粗暴的算力堆疊給沖淡。大家都在等那個標誌性的橙色圖標再次閃爍,哪怕只是一個 API 更新文檔也好。