OpenAI co-founder Andrej Karpathy joins Anthropic’s pre-training team

Andrej Karpathy 確認加入 Anthropic 預訓練團隊。這位 OpenAI 的共同創始人、前 Tesla 自動駕駛主管在結束其短暫的獨立教育專案後，正式進入這間由 OpenAI 前高管 Dario Amodei 及其胞妹 Daniela Amodei 創立的研究機構。預訓練是大型語言模型開發中資源消耗最密集的環節，負責將海量原始數據轉化為 Claude 系列模型的核心知識與邏輯框架，其成本佔據模型研發總預算的比例最高，且直接決定了模型最終的認知上限。根據官方釋出的資訊，Karpathy 將直接參與未來前沿模型（Frontier Models）的基礎建構工作，該團隊主要負責管理數萬枚高性能 GPU 的協同運作，以及優化在大規模分佈式系統上的訓練效率。Karpathy 在電腦視覺與深度學習領域具備超過十年的研究經驗，其在史丹佛大學開設的卷積神經網絡課程（CS231n）與近期發布的「從零開始寫 GPT」教學系列，在學術界與工程界均具備廣泛影響力。此次人事變動發生在 OpenAI 核心技術人才持續流失的背景下，標誌著矽谷頂尖技術資本在主要研發機構間的再次重組與權力移轉。Anthropic 此前已獲得來自亞馬遜與 Google 的巨額投資，其研發方向長期聚焦於所謂的「AI 安全性」與「憲法 AI」架構，預訓練環節正是這些底層防禦機制植入的起點。

矽谷這場大型的人才搬運戲碼，讀起來總讓人想起文藝復興時期流動的學術匠人，哪位領主的金幣更閃耀、哪座城堡的實驗室更安靜，大師便往哪裡去。Karpathy 這種級別的人物加入 Anthropic，與其說是技術增援，不如說是一場關於「正統性」的爭奪。當初為了逃離某個被商業資本過度稀釋的理想國，Amodei 兄弟帶走了一批種子，如今這些種子長成了足以與舊主分庭抗禮的高牆。Karpathy 在網路上教全世界如何用純手工方式刻出一個 GPT 的時候，那種帶著清教徒色彩的科普熱情，與現在進入這間極度強調「閉源」與「精英主義」的實驗室，多少顯出一種微妙的諷刺。預訓練這塊田地，聽起來像是技術皇冠上的明珠，實則更像是一座充滿噪音與熱氣的鍋爐房。一個能把自動駕駛代碼寫得像藝術品的人，現在要去處理那些動輒數十億、數萬億參數的混沌數據，這究竟是天才的歸宿，還是一種高級的勞務派遣？

當所有人都在討論模型如何變得更聰明、更具備「人味」時，這些頂尖大腦卻在重複著最原始的「餵食」工作。他們在追求一種極致的、難以言說的規模效應，彷彿只要把算力堆疊到某個臨界點，神蹟就會自然降臨。這種對「大力出奇蹟」的集體信仰，讓這些學者的身影顯得有些像是在神廟裡修補神像的工匠，他們知道每一塊磚的位置，卻未必知道神像最後會對信徒說出什麼樣的預言。Anthropic 總是掛在嘴邊的「安全性」，在預訓練階段往往意味著更多的過濾、更多的禁忌與更厚的圍牆。Karpathy 的加入，是否意味著未來的 Claude 會具備更精準的邏輯，還是會變成一個更完美、更無懈可擊的「安全黑箱」？看著這些曾經標榜開放與共享的先驅們，一個接一個地鑽進造價數十億美金的封閉象牙塔，這種景象本身就是對「開放科學」最冷酷的嘲弄。大家都在談論通用人工智能的黎明，卻沒人敢直視那個黎明是用多少堆疊出來的算力廢墟換來的。

當所有的頂尖大腦都匯聚在極少數幾間擁有萬卡集群的「實驗室」裡，這種智力的壟斷是否會導致某種形式的演化停滯？如果預訓練的範式最終被證明只是對算力與數據的無盡渴求，那麼天才的加入，是為了加速突破人類認知的邊界，還是僅僅為了在日益同質化的技術競賽中，為自家產品貼上一張更有質感的名牌標籤？如果未來的某一天，算力的增長觸及了物理或經濟的極限，而我們依然無法解釋預訓練黑箱裡的每一根神經元是如何跳動的，那麼現在這種大規模的人才遷徙，是否會被後世視為一場壯麗卻盲目的集體豪賭？當模型具備了所有人類的知識，卻依然缺乏一個可以被解釋的靈魂時，下一個被招募的天才，又該去修補哪一個環節？如果我們最終得到的只是一個比人類更聰明、卻也比人類更難以理解的怪物，那麼 Karpathy 們在預訓練階段所做的每一分優化，究竟是在為人類文明續命，還是在為一種我們終將無法掌控的意志修築地基？