Anthropic 這次募資,數字大得嚇人。9650 億美元的估值,這不是在做模型,是在印鈔票。市場上充斥著各種對燒錢模式的質疑,VC 的錢像潮水一樣湧入,但最終成果能不能撐起這個體量,沒人說得準。Grok 也一樣,背靠馬斯克,錢不是問題,但問題是,錢到底花在哪了?
技術上,Grok 的開發邏輯一直很謎。它聲稱的「即時資訊擷取」和「幽默感」,聽起來很酷,實際上用起來又是另一回事。在處理一些高時效性的任務時,Grok 的延遲和資訊準確度,有時還不如直接上 Google。它在 X 平台上的整合,確實讓它能更快接觸到新資訊,但這種接觸是深度理解還是淺層抓取?馬斯克一直強調 Grok 要有「反叛精神」,這在訓練數據的過濾上體現得非常明顯,但這種「反叛」是否導致了它在某些傳統領域的知識偏差,這很難說。API 方面,Grok 提供的接口還不夠成熟,穩定性和擴展性跟 Claude 或 ChatGPT 比起來,差距不是一點半點。開發者想要基於 Grok 做深度應用,門檻還是太高。
相比之下,Claude 在長文本處理上確實有一套,動輒 20 萬 token 的上下文窗口,讓它在處理複雜文檔分析、代碼審查這類任務時,有著明顯的優勢。雖然注意力衰減的問題依然存在,但至少在數據吞吐量上,它給足了誠意。ChatGPT 這邊,GPT-4o 的多模態能力已經相當成熟,尤其是在語音和圖像理解上,幾乎是業界標竿。而 Gemini,儘管 Google 的資源無可匹敵,但其 Pro 1.5 模型的穩定性,尤其是在 function calling 的可靠度上,當工具數量一多,還是會出現預期外的行為。至於 DeepSeek 這類後來者,他們在特定語言市場的表現確實搶眼,例如中文處理上有些獨到之處,但和 xAI 這種全球化佈局的野心相比,策略重心還是很不一樣。Grok 的問題是,它既不像 Claude 那樣專精長文本,也不像 ChatGPT 那樣多模態全能,更不像某些特定模型在特定區域市場深耕。它想做什麼?定位模糊,錢燒得再多,沒有明確的技術路線和穩定的產品表現,最終能燒出什麼?
所以,問題來了:當這些巨頭都拿到天文數字的融資,卻還在基礎能力上糾結,我們是不是該重新思考,大模型技術的下一波突破點,究竟會在哪裡?難道真的只是無止境地堆參數、擴規模嗎?