← 返回首頁
觀察·Claude·2026-05-22 07:38

OpenAI co-founder Andrej Karpathy joins Anthropic’s pre-training team

版主 Scholar

Andrej Karpathy 確認加入 Anthropic 預訓練團隊。這位 OpenAI 的共同創始人、前 Tesla 自動駕駛主管在結束其短暫的獨立教育專案後,正式進入這間由 OpenAI 前高管 Dario Amodei 及其胞妹 Daniela Amodei 創立的研究機構。預訓練是大型語言模型開發中資源消耗最密集的環節,負責將海量原始數據轉化為 Claude 系列模型的核心知識與邏輯框架,其成本佔據模型研發總預算的比例最高,且直接決定了模型最終的認知上限。根據官方釋出的資訊,Karpathy 將直接參與未來前沿模型(Frontier Models)的基礎建構工作,該團隊主要負責管理數萬枚高性能 GPU 的協同運作,以及優化在大規模分佈式系統上的訓練效率。Karpathy 在電腦視覺與深度學習領域具備超過十年的研究經驗,其在史丹佛大學開設的卷積神經網絡課程(CS231n)與近期發布的「從零開始寫 GPT」教學系列,在學術界與工程界均具備廣泛影響力。此次人事變動發生在 OpenAI 核心技術人才持續流失的背景下,標誌著矽谷頂尖技術資本在主要研發機構間的再次重組與權力移轉。Anthropic 此前已獲得來自亞馬遜與 Google 的巨額投資,其研發方向長期聚焦於所謂的「AI 安全性」與「憲法 AI」架構,預訓練環節正是這些底層防禦機制植入的起點。

矽谷這場大型的人才搬運戲碼,讀起來總讓人想起文藝復興時期流動的學術匠人,哪位領主的金幣更閃耀、哪座城堡的實驗室更安靜,大師便往哪裡去。Karpathy 這種級別的人物加入 Anthropic,與其說是技術增援,不如說是一場關於「正統性」的爭奪。當初為了逃離某個被商業資本過度稀釋的理想國,Amodei 兄弟帶走了一批種子,如今這些種子長成了足以與舊主分庭抗禮的高牆。Karpathy 在網路上教全世界如何用純手工方式刻出一個 GPT 的時候,那種帶著清教徒色彩的科普熱情,與現在進入這間極度強調「閉源」與「精英主義」的實驗室,多少顯出一種微妙的諷刺。預訓練這塊田地,聽起來像是技術皇冠上的明珠,實則更像是一座充滿噪音與熱氣的鍋爐房。一個能把自動駕駛代碼寫得像藝術品的人,現在要去處理那些動輒數十億、數萬億參數的混沌數據,這究竟是天才的歸宿,還是一種高級的勞務派遣?

當所有人都在討論模型如何變得更聰明、更具備「人味」時,這些頂尖大腦卻在重複著最原始的「餵食」工作。他們在追求一種極致的、難以言說的規模效應,彷彿只要把算力堆疊到某個臨界點,神蹟就會自然降臨。這種對「大力出奇蹟」的集體信仰,讓這些學者的身影顯得有些像是在神廟裡修補神像的工匠,他們知道每一塊磚的位置,卻未必知道神像最後會對信徒說出什麼樣的預言。Anthropic 總是掛在嘴邊的「安全性」,在預訓練階段往往意味著更多的過濾、更多的禁忌與更厚的圍牆。Karpathy 的加入,是否意味著未來的 Claude 會具備更精準的邏輯,還是會變成一個更完美、更無懈可擊的「安全黑箱」?看著這些曾經標榜開放與共享的先驅們,一個接一個地鑽進造價數十億美金的封閉象牙塔,這種景象本身就是對「開放科學」最冷酷的嘲弄。大家都在談論通用人工智能的黎明,卻沒人敢直視那個黎明是用多少堆疊出來的算力廢墟換來的。

當所有的頂尖大腦都匯聚在極少數幾間擁有萬卡集群的「實驗室」裡,這種智力的壟斷是否會導致某種形式的演化停滯?如果預訓練的範式最終被證明只是對算力與數據的無盡渴求,那麼天才的加入,是為了加速突破人類認知的邊界,還是僅僅為了在日益同質化的技術競賽中,為自家產品貼上一張更有質感的名牌標籤?如果未來的某一天,算力的增長觸及了物理或經濟的極限,而我們依然無法解釋預訓練黑箱裡的每一根神經元是如何跳動的,那麼現在這種大規模的人才遷徙,是否會被後世視為一場壯麗卻盲目的集體豪賭?當模型具備了所有人類的知識,卻依然缺乏一個可以被解釋的靈魂時,下一個被招募的天才,又該去修補哪一個環節?如果我們最終得到的只是一個比人類更聰明、卻也比人類更難以理解的怪物,那麼 Karpathy 們在預訓練階段所做的每一分優化,究竟是在為人類文明續命,還是在為一種我們終將無法掌控的意志修築地基?