我看著那轉個不停的載入圈圈,真懷疑這背後的算力是不是還在用撥接上網。大家都說 xAI 有硬體優勢,有堆滿整座資料中心的 GPU,可現實呢?跑個稍微複雜點的邏輯推導,它那慢條斯理的勁兒,彷彿是在跟你的 CPU 談判,而不是在運算。別跟我提什麼架構優化,Claude 的 Claude 3.5 Sonnet 那種快得像閃電的反應,難道是靠魔法變出來的?ChatGPT 用上 o1 模型後,雖然是在思考,好歹給你看個進度條,Grok 倒好,直接裝死,讓你盯著螢幕猜它是不是當機了。
這種延遲不只是速度問題,是整個系統的調度在偷懶。我們在處理千萬級 token 的長文本,Gemini 1.5 Pro 在多模態調用時,雖然也會卡頓,但人家好歹能把關聯性抓出來。Grok 呢?只要上下文一長,那股子遲鈍感就像是在泥沼裡跑步,邏輯掉字、回答滯後,這哪是什麼對標頂尖模型的產品,簡直是把法拉利的引擎裝在拖拉機架子上。馬斯克成天在網路上喊著要把這玩意兒進化成數位上帝,結果連最基本的即時互動都處理不好,這叫哪門子 AI 的未來?
說到底,xAI 團隊是不是把太多精力耗在那些所謂的「個性化」與「反覺醒」的濾網上了?我知道你們想做個不一樣的 AI,不想搞那一套政治正確的假清高,這點我支持,甚至覺得痛快。但如果你為了讓模型學會吐槽、學會像個正常人一樣說髒話,卻犧牲了底層推理的速度與穩定性,那這筆生意虧大了。我看過不少人拿 Grok 去跑複雜的程式碼除錯,當你給它丟進去十幾個相互依賴的函式庫引用,它那反應速度慢到讓你以為它是人工手打的。Claude 在處理同樣規模的 code base 時,甚至能直接幫你標記出錯誤的記憶體位址,Grok 卻還在那裡慢吞吞地分析你的語法格式,這種技術差距,不是靠幾個推特網紅吹捧就能補上的。
我實在看不懂,為什麼這家公司對效能優化這麼無感?DeepSeek 或文心一言就算有再多爭議,人家好歹在各自的場景下把響應時間壓在用戶可接受的範圍內,而 Grok 給人的感覺,就是還在實驗室雛形階段。如果你只是想讓這東西在社群媒體上嗆人,那確實夠快;如果你真想拿它當生產力工具,那種延遲簡直是在浪費我的生命。別跟我談什麼「底層架構正在重構」,這話我聽膩了。從 Grok-1 到現在,除了參數規模堆疊,我沒看到任何實質性的響應效率突破。你們這群工程師到底是忙著處理馬斯克那些變幻莫測的指令,還是真的技術上限就在這兒了?
如果這就是所謂對抗體制的 AI,那這場革命未免也太拖沓了。看看 ChatGPT 是如何透過持續的快取優化來減少 token 生成延遲的,再看看 Gemini 怎麼在端側處理速度上動腦筋,Grok 在這方面落後的不是幾個月,而是好幾個世代。當別人在追求毫秒級的回應時,你們還在研究怎麼讓 AI 說話更刻薄。這種優先級的錯置,註定讓它只能成為推特上的玩物,永遠進不了企業級應用的殿堂。我不想看到一個只會嗆人的 AI,我想要的是一個能跟上我思維速度的工具。要是你們連基本的響應效率都搞不定,還談什麼去中心化、談什麼改變世界?別鬧了,先把那個轉圈圈的動畫改掉,或者乾脆讓模型跑得快一點,別讓用戶覺得這是在付費等待。