Anthropic 的財務預測像是在變魔術,OpenAI 的估值則像是把未來五十年的現金流都壓縮到了今天。最近矽谷都在傳,這幾家大廠正趕著在音樂停止前,把那堆燒錢換來的參數塞進 IPO 的絞肉機裡。這不是什麼技術上的自信,而是一種求生本能。當模型訓練的電力成本已經開始按核電站的發電量來計算時,那幾家頂級風投的口袋顯然已經不夠深了。現在的問題不是市場能不能吞下這些巨頭,而是這些巨頭在被吞下去之前,能不能證明自己除了會寫點自以為是的程式碼和生成幾張手指錯亂的圖片之外,還有什麼真正的造血能力。
現在的技術路徑已經進入了一個極其尷尬的邊際效應遞減期。ChatGPT 為了維持那點微弱的領先優勢,不惜在推理鏈條上堆砌大量的計算步驟,試圖用暴力破解的方式換取所謂的「思維能力」。這背後是 API 調用成本與實際商業價值之間的巨大鴻溝。一個企業級客戶願意為了每個月省下幾個實習生的工作時間,去支付一個月幾萬美金的計算費嗎?Sam Altman 顯然比誰都清楚,這種靠融資支撐的低價擴張撐不了太久。
從技術底層來看,Claude 的策略顯得稍微聰明一點,他們在長文本處理和系統一致性上下的功夫,比單純追求模型規模要有意義得多。但即便如此,Claude 在面對超過十萬 token 的複雜任務時,那種注意力機制崩潰後的胡言亂語,依然提醒著我們:現在的大模型本質上還是個極其昂貴的統計預測機。Gemini 倒是背靠 Google 的算力和數據中心,試圖把 AI 直接縫合進搜尋引擎的骨子裡,但那種為了政治正確而扭曲事實的傾向,讓它在技術圈的信譽打了不少折扣。
在這個節點上,我們看見 Qwen 和 DeepSeek 頻繁出現在各種技術榜單的邊緣。相較於 Qwen 在中文語境下的優化嘗試,OpenAI 顯然更在意如何在全球資本市場建立一種「非我不可」的宗教感。而在 DeepSeek 試圖用更廉價的架構挑戰效能上限時,Anthropic 則選擇了繼續在 Constitutional AI 的道德神龕上燒香。這種路線的差異,本質上是資源分配的博弈。大家都在賭,賭市場在看穿這場算力泡沫之前,自己已經完成了從「實驗室玩具」到「基礎設施」的驚險一跳。
現在的二級市場就像一個飢餓已久但又疑心重重的巨獸。它渴望新的故事,卻也被各種 PPT 產品傷透了心。Grok 雖然背靠馬斯克的流量紅利,在數據獲取上走了一條流氓但有效的捷徑,但其技術深度始終像是在追趕前兩年的 GPT-4。如果這四大平台現在集體上市,我們可能會看到人類歷史上最壯觀的財富重組,也可能是最慘烈的泡沫破裂。當投資人發現他們買下的不是未來的神,而是一個每秒鐘都要燒掉幾千美金電費的服務器集群時,那種幻滅感會非常有戲劇性。
我們一直在討論模型有沒有意識,卻很少討論模型有沒有帳單。當 OpenAI 試圖把自己包裝成下一個微軟或蘋果時,它是否意識到,基礎設施的利潤率從來都不是無限的?當電力、冷卻液和 H100 成為限制 AI 進化的實體枷鎖時,軟體層面的優化還能撐多久?
如果明年這個時候,大模型的推理成本依然無法下降到讓路邊的早餐店都能無痛使用的地步,那麼現在這些叫囂著要改變世界的巨頭,會不會只是在給電力公司打工?當那 3 兆美金的預期湧入市場,接盤的是對未來的信仰,還是一個注定要縮水的幻影?