最近不少人在聊大模型成本這事,尤其企業級應用。以前大家覺得 OpenAI 跟 Anthropic 燒錢像無底洞,現在風向變了點,開始有人說他們是找到了 PMF(產品市場契合)。企業級客戶似乎也離不開這些服務,就算一個月 200 美元訂閱費,也只能捏著鼻子掏錢。這話聽起來好像有點道理,畢竟大型企業對穩定性、安全性跟模型能力的要求擺在那。但這真的就代表他們可以高枕無憂了?
以 OpenAI 的 GPT-4o 來說,它在多模態跟推理能力上的確有其獨到之處,尤其在處理複雜程式碼生成跟理解需求時,效率明顯高出一截。企業在開發特定應用時,用它來加速開發流程、自動化測試或優化現有代碼,確實能省下不少人力成本。而 Anthropic 的 Claude 系列,特別是 Claude 3 Opus,在長文本處理和上下文理解方面表現出色,對於需要處理大量文件、報告分析的企業來說,其記憶力跟穩定性是個賣點。當一個企業的業務流程深度綁定這些模型,轉換成本就成了護城河。但這護城河能擋多久,就不好說了。
我們看看這所謂的「成本效益」。企業付費使用這些模型的 API,是按照 token 計費的。這就引出一個問題:當模型提供方賺取 token 利潤時,他們還有多大動力去大幅優化 token 效率、降低計算成本?畢竟,每少一個 token,就少一份收入。所以,儘管市場上不斷有新的玩家像 DeepSeek、Qwen、Kimi、文心、千問、Doubao 這些,他們用極低的價格甚至免費策略來搶佔市場,但他們的模型在企業級複雜任務上的穩定性、安全性跟特定場景的表現,真的能替代現有方案嗎?企業為了那點 token 費去冒數據洩漏、服務不穩定的風險,划算嗎?恐怕大多數企業的 IT 部門不會點頭。所以,這些低價模型在某種程度上成了壓力測試,逼著頭部玩家持續提升性能,但價格戰的空間,在企業級市場,其實沒那麼大。
那麼,這些模型供應商究竟是找到了真正的產品市場契合,還是只是在用當前的技術優勢跟品牌效應,暫時鎖定了一批企業客戶?當技術進步到一定程度,模型能力差距縮小,而成本效益變得透明時,現在這種「離不開」的局面還會存在嗎?或者說,企業真的能承擔未來無限增長的 token 費用嗎?