近期,大模型在企業應用中的定位,似乎從「未來趨勢」轉變為「成本中心」——這無疑是一種進化,但也帶來了新的焦慮。當企業級用戶開始嚴格限制員工使用模型的頻率與型號,甚至開始計算「公司代幣」的消耗時,我們便能窺見,這場曾被視為無限可能的 AI 盛宴,終究要回到現實世界的損益表上。這不再是技術人員實驗新玩具的樂園,而是財務長們權衡投入產出比的戰場。
過去一年多,我們見證了模型能力以驚人的速度躍進,尤其在程式碼生成、複雜邏輯推理等領域,Claude 3 系列與 GPT-4o 的表現確實令人咋舌。以程式開發為例,Claude 3 Opus 在多步驟任務規劃、長文本上下文理解方面展現出的優勢,讓許多開發者得以將過去耗時數日的重構工作壓縮至數小時。其在處理超過 8 萬 token 的長文本時,雖然偶有注意力衰減的跡象,但其整體穩定性與錯誤檢測能力,相較於早期模型已是天壤之別。這類性能提升,的確為企業帶來了實質的效率飛躍,但問題也隨之浮現:這種效率的邊際成本究竟是多少?當一個模型單次調用涉及數萬甚至數十萬 token,累積起來的費用便足以讓任何一家企業的財報部門心驚肉跳。
這也難怪最近市場上,諸如 DeepSeek reasonix 這類模型頻頻以驚人的價格策略現身,其宣稱的百倍級降價,無疑是對現有格局的一次強烈衝擊。相較於 DeepSeek reasonix 以近乎「白菜價」試圖搶佔市場,Claude、ChatGPT 與 Gemini 這些主流玩家,在企業級市場上的定價策略,顯然更著重於其背後的研發投入、模型品質與企業級服務的穩定性。它們提供的不僅是模型本身,更包含了一整套的安全保障、隱私承諾與技術支援,這些都是中小企業在應用 AI 時難以自行承擔的「隱性成本」。然而,當成本的壓力如影隨形,企業究竟會選擇為「信任」和「頂尖性能」支付高價,還是轉向那些「夠用就好」的經濟實惠方案?
當我們將焦點從純粹的技術性能轉移到實際的商業營運,模型提供商的盈利模式與企業的成本控制便構成了新的拉鋸戰。是繼續追求單一模型在各項指標上的極致表現,進而推高 API 調用成本,還是轉向更注重 token 效率、透過架構優化來降低算力消耗的模型?這兩種不同的發展路徑,將如何影響下一波 AI 創新的方向?而那些已經習慣了每月數百美元訂閱費的企業,在面對市場上層出不窮的低價選擇時,會如何重新評估其 AI 戰略?