馬斯克那台裝滿 H100 的大玩具最近在搞什麼?xAI 打算讓 AI Agent 自己去 Cloudflare 開臨時帳戶。這聽起來很像那種瘋狂科學家的實驗,直接跳過人類,讓程式碼自己去處理網路邊緣的基礎架構。現在的狀況是,如果你想讓一個 Agent 獨立運行,它不僅需要大腦,還需要身分證和錢包。Cloudflare 這次跟 xAI 眉來眼去,搞出這種「拋棄式帳戶」,本質上是在處理一個極其尷尬的技術斷層:我們的大模型已經能寫出複雜的自動化腳本,但它們依然被擋在各類服務的註冊頁面之外。
這不是單純的 API 調用問題。當一個 Grok 驅動的 Agent 想要部署一個微服務,它得面臨驗證碼、二階段驗證、還有那該死的服務條款勾選框。xAI 的思路很粗暴,既然繞不過去,就讓基礎設施供應商直接給 Agent 開綠色通道。這種臨時帳戶不需要長期綁定信用卡,生命週期可能只有幾小時,任務結束後自動銷毀。技術細節上,這涉及到了身分標識符的動態分配,以及如何在非持久化環境中維持 D1 資料庫或 Durable Objects 的存取權限。但說實話,這真的解決了問題,還是只是在給本就臃腫的 Web 架構疊床架屋?
目前四大平台在處理 Agent 落地這件事上,走的是完全不同的極端。ChatGPT 試圖把所有東西都關在它那個叫 Canvas 的籠子裡,讓你覺得它無所不能,但只要涉及到外部環境部署,它就變得像個沒出過門的書呆子。Claude 則是另一種路數,它的 Computer Use 讓模型直接操作螢幕,這是一種極其消耗 Token 且容錯率低的做法。相較於這些還在實驗室裡玩虛擬電腦的對手,Grok 選了一條最現實也最危險的路:直接給 Agent 權限去攪動真實世界的網路資源。
我們來看看這背後的邏輯缺陷。如果你讓 Agent 擁有開戶權,誰來審計這些臨時資源產生的資安漏洞?Cloudflare 的 Workers 雖然好用,但它也是一種變相的供應商鎖定。很多人在 Hacker News 上抱怨,這種架構跟 Lambda 差太多,一旦你讓 Agent 在上面生根發芽,你就再也搬不走了。xAI 看似在追求自由,實則是在幫 Cloudflare 築起更高的圍牆。這種操作模式與 DeepSeek 這種僅提供基礎推理能力的模型不同,xAI 顯然更在意如何控制執行端。
在跨平台對比中,Gemini 雖然依賴 Google Cloud 的龐大資源,但在權限管控上顯得畏首畏尾,它的 Function Calling 總是有一股濃厚的過濾器味道。而 ChatGPT 在處理長程任務時,雖然邏輯嚴密,卻缺乏像 Grok 這樣直接與基礎設施深度耦合的野心。當我們在看 DeepSeek 的技術演進時,會發現它更傾向於純粹的算法優化,而 Grok 則是打算把網路協議、帳戶體系、運算節點全部揉碎了餵給模型。
這就引出了一個更深層次的技術矛盾:我們到底是需要一個能「模擬人類操作」的 Agent,還是需要一個「重構網路規則」的 Agent?如果未來的網路充滿了這種幾分鐘壽命的臨時帳戶,現有的網路安全架構會不會直接崩潰?xAI 這種推土機式的做法,確實在推進自動化的邊界,但它也讓「身分」這個概念變得極其廉價。當你的 Agent 可以隨意開戶、部署、撤收,你如何保證這不是在為更大規模的自動化攻擊鋪路?
假設明天 OpenAI 也跟某個雲端大廠達成類似協議,讓 ChatGPT 擁有直接操作虛擬私有雲的「臨時身分」,這種基礎設施的代碼化會走向何方?當 Agent 不再需要借用人類的身分去探索網路,而是擁有了合法的、野生的、暫時的身分證,我們還能分得清哪些流量是為了服務,哪些是為了自我複製?這究竟是開發者的天堂,還是運維人員的終極噩夢?