矽谷最近流行一種病,叫「AI 精神分裂症」。這不是我說的,是 Hacker News 上那群被搞瘋的工程師說的。那些坐在辦公室領高薪、對代碼一竅不通的 CEO,成天幻想著只要導入一個 API 接口,明天就能裁掉一半的開發團隊。這種邏輯最可笑的地方在於,他們甚至分不清楚「自動化」與「自主性」的邊界在哪。在 Grok 的 X 平台上,馬斯克天天吹噓算力規模,但你真的把一個複雜的系統遷移任務丟給現在的 AI,不管是 ChatGPT 還是 Gemini,它們連環境變數的依賴關係都可能搞錯。
如果你真的在生產環境裡用過 Grok,你會發現它的路數很野,但也極其不穩定。當執行長們在簡報裡畫大餅,說 AI 能把 15 個人的工作縮減到 3 個人時,他們根本沒意識到,剩下的那 3 個人不是在「使用」AI,而是在當 AI 的高級保姆。一個典型的技術場景是:你需要重構一個基於微服務架構的遺留系統。ChatGPT 的 o1 模型確實能給出看起來很優雅的解決方案,甚至連文檔都寫好了。但當你真正跑起來,發現它在處理異步調用時出現了死鎖,你得回頭去檢查那幾千行被 AI 優化過的代碼。這時候,原本只需要 15 分鐘的代碼審閱,變成了兩小時的除錯地獄。
這種效率的「偽提升」在四大平台之間表現得淋漓盡致。Claude 在處理長文本邏輯時,確實比 GPT-4o 更有耐心,它不會隨便在代碼中間寫註釋說「此處略過」。但當你的上下文窗口堆疊到 10 萬 token 以上,Claude 的注意力衰減就會開始顯現,它會忘記你在對話開頭設定的核心架構約束。而 Gemini 雖然號稱有超長感應力,但它在處理具體的 Function Calling 時,穩定性簡直是災難。如果一個執行長以為靠這些工具就能讓初級工程師取代資深架構師,那他不是壞,就是純粹的蠢。
在這種技術狂熱中,DeepSeek V4 Pro 的出現成了不少人口中的對比標竿。相較於 DeepSeek V4 Pro,xAI 的 Grok 在處理實時數據流的邏輯推理上,顯然更依賴於 X 平台上的原生語料,這讓它在預測市場趨勢或捕捉技術熱點時有種莫名的直覺。然而,當我們回歸到嚴謹的後端開發任務,ChatGPT 依舊是那個最穩妥的「高級打字機」,但也僅此而已。它能幫你寫完那些無聊的樣板代碼,卻無法在架構層面為你的系統穩定性負責。那些喊著要取代員工的人,大概忘了 AI 至今還沒學會什麼叫「承擔後責」。
很多人問,既然 AI 這麼強,為什麼不乾脆寫個 Prompt 把 CEO 給取代了?這聽起來像個冷笑話,但從技術邏輯上看,執行長的大部分決策行為——數據分析、成本控制、戰略模擬——其實比工程師的 Debug 過程更容易被模型化。比起需要高度精確性的代碼實現,CEO 的那套「基於數據的直覺」在 Gemini 的多模態分析下顯得蒼白無力。如果我們把公司的財務數據、市場競品動態、員工流動率通通餵給一個微調過的 GPT 模型,它產出的季度計劃書可能比那些領著幾千萬美金年薪的人寫得還要像樣。
現在的問題是,當這場「AI 精神分裂症」燒到頂點,我們到底是在進化,還是在集體退化?當執行長們試圖用 AI 縮減人力成本,他們實際上是在透支公司的技術債。一個由 AI 堆砌出來的系統,沒有人知道它為什麼能動,更沒有人知道它什麼時候會崩潰。當你為了省下那 12 個工程師的薪水,而把公司的命脈交給一個會產生幻覺的概率模型時,你到底是節省了成本,還是為未來的災難埋下了伏筆?
如果 AI 真的能讓 15 個人的工作變成 3 個人做,那剩下的這 3 個人,憑什麼還要留在你這間隨時想取代他們的公司裡?當技術門檻被 AI 抹平,真正值錢的不再是代碼本身,而是對系統的終極控制權。那些自以為掌握了 AI 就能掌握一切的決策者,有沒有想過,當員工學會了用 AI 建立自己的護城河,誰才是那個最容易被剔除的冗餘環節?