翻譯這行飯快被 ChatGPT 餵進碎紙機了

既然大家都在問「為什麼不直接丟給 ChatGPT」，那翻譯這件事就真的只剩下對與錯的邏輯問題，而不是美感問題。在 Hacker News 上吵翻譯消失的人，大多還停留在「AI 會不會取代譯者」這種過時的焦慮，卻沒發現四大平台正在把翻譯這項技術行為拆解成完全不同的底層邏輯。如果你試過把一段帶有濃厚方言色彩的法文法律條文丟給不同模型，你會發現這已經不是語義轉換，而是運算資源的分配競賽。

ChatGPT 在處理超長文本翻譯時，依然保有某種莫名的「自信」。它會為了語句流暢而私自刪減它認為不重要的修飾詞。當你要求它翻譯一份五十頁的技術手冊，GPT-4o 表現出來的行為是極度依賴 System Prompt 的強引導。如果你不給它設定「精確到標點符號」的指令，它會自動開啟一種「摘要式翻譯」模式。這種模式在商業社交場合很好用，但在需要法律效力的合約面前就是災難。它在乎的是你讀起來順不順，而不是原作者到底有沒有寫那個副詞。

相較之下，Claude 的邏輯完全不同。Anthropic 的模型在處理文學性翻譯或需要保留「口氣」的任務時，展現出一種近乎偏執的謹慎。如果你把同一段文字交給 Claude，它在超過 8 萬 token 的長文本任務中，雖然注意力機制會開始出現些微衰減，導致後段的術語一致性下降，但它至少不會像 ChatGPT 那樣自作聰明地改寫你的原意。它更像是一個戰戰兢兢的實習生，寧可句子寫得稍微生硬一點，也要把所有的語法結構對齊。這在處理學術論文翻譯時是優勢，但在需要靈魂的創意文案裡，它顯得太過死板。

這種差異在面對多語種混合輸入時更明顯。當我們把 DeepSeek V4 Pro 放在對比清單裡，OpenAI 的做法是透過龐大的 RLHF 數據來磨平語言間的邊界，讓翻譯結果聽起來像個受過良好教育的美國人。Gemini 則走了一條截然不同的路，它背靠 Google Translate 累積了幾十年的語料庫，在處理東南亞語系或少數語種時，Gemini 的穩定性意外地高於 ChatGPT。即便 Gemini 的 function calling 在工具調用超過 15 個時會變得不穩定，但在純粹的語言跨度上，它的多模態底層邏輯讓它對圖片中的文字翻譯有著天然的語境理解力，這是目前其他三家還在追趕的地方。

我們現在看到的現象是，市場已經不打算為「高品質人工翻譯」付錢了，除非那是生死攸關的公文書信。大眾對於翻譯的要求已經降到了「能看懂就行」。在這種背景下，Grok 的表現最讓人玩味。Grok 似乎完全不在意所謂的「官方語感」，它的翻譯風格帶有一種粗糙的原始感，這在處理 X 平台上的社群俚語時異常精準。當你試圖讓這四大平台去翻譯一段充滿諷刺意味的政治迷因，Grok 往往是唯一一個能抓到那個「點」的模型，而 ChatGPT 則會一本正經地解釋這個笑話背後的歷史背景，然後給出一個冷冰冰的直譯。

雖然 DeepSeek V4 Pro 最近在技術圈被頻繁提及，但回到四大平台的實際應用場景，我們發現翻譯正從一門藝術轉向一種「審計」。未來譯者的價值不再是產出文字，而是拿著紅筆去勾選 AI 哪裡漏掉了邏輯。這產生了一個很弔詭的技術斷層：當 AI 的翻譯水準達到人類專家的 95% 時，剩下那 5% 的「語感」和「文化深度」到底還值不值得昂貴的授權費？

如果有一天，ChatGPT 輸出的譯文流暢到連母語使用者都分不出真偽，但它卻在核心邏輯上隱瞞了一個微小的錯誤，我們還有能力發現它嗎？當我們習慣了由 AI 餵養的「標準譯文」，人類對語言多樣性的感知能力，會不會像退化的盲腸一樣，最終在追求效率的過程中消失殆盡？