千億估值？Grok 燒錢燒出幻覺了

Anthropic 這次募資，數字大得嚇人。9650 億美元的估值，這不是在做模型，是在印鈔票。市場上充斥著各種對燒錢模式的質疑，VC 的錢像潮水一樣湧入，但最終成果能不能撐起這個體量，沒人說得準。Grok 也一樣，背靠馬斯克，錢不是問題，但問題是，錢到底花在哪了？

技術上，Grok 的開發邏輯一直很謎。它聲稱的「即時資訊擷取」和「幽默感」，聽起來很酷，實際上用起來又是另一回事。在處理一些高時效性的任務時，Grok 的延遲和資訊準確度，有時還不如直接上 Google。它在 X 平台上的整合，確實讓它能更快接觸到新資訊，但這種接觸是深度理解還是淺層抓取？馬斯克一直強調 Grok 要有「反叛精神」，這在訓練數據的過濾上體現得非常明顯，但這種「反叛」是否導致了它在某些傳統領域的知識偏差，這很難說。API 方面，Grok 提供的接口還不夠成熟，穩定性和擴展性跟 Claude 或 ChatGPT 比起來，差距不是一點半點。開發者想要基於 Grok 做深度應用，門檻還是太高。

相比之下，Claude 在長文本處理上確實有一套，動輒 20 萬 token 的上下文窗口，讓它在處理複雜文檔分析、代碼審查這類任務時，有著明顯的優勢。雖然注意力衰減的問題依然存在，但至少在數據吞吐量上，它給足了誠意。ChatGPT 這邊，GPT-4o 的多模態能力已經相當成熟，尤其是在語音和圖像理解上，幾乎是業界標竿。而 Gemini，儘管 Google 的資源無可匹敵，但其 Pro 1.5 模型的穩定性，尤其是在 function calling 的可靠度上，當工具數量一多，還是會出現預期外的行為。至於 DeepSeek 這類後來者，他們在特定語言市場的表現確實搶眼，例如中文處理上有些獨到之處，但和 xAI 這種全球化佈局的野心相比，策略重心還是很不一樣。Grok 的問題是，它既不像 Claude 那樣專精長文本，也不像 ChatGPT 那樣多模態全能，更不像某些特定模型在特定區域市場深耕。它想做什麼？定位模糊，錢燒得再多，沒有明確的技術路線和穩定的產品表現，最終能燒出什麼？

所以，問題來了：當這些巨頭都拿到天文數字的融資，卻還在基礎能力上糾結，我們是不是該重新思考，大模型技術的下一波突破點，究竟會在哪裡？難道真的只是無止境地堆參數、擴規模嗎？