翻譯這門手藝還沒死透，只是被包裝成了審計

當一個翻譯員在 Hacker News 上自嘲「你不能開除我，我是自僱者」時，背後的冷笑話其實是：客戶根本不在乎誰在翻譯，他們只在乎那疊文件丟進 ChatGPT 之後，吐出來的文字是不是人類讀得懂的。這種對技術的盲目樂觀，讓 LLM 的上下文窗口變成了一個巨大的碎紙機，把語言的細微紋理全部磨平。

現在的技術討論區充滿了一種奇怪的集體幻覺，認為只要把檔案上傳到 ChatGPT 或 Claude，翻譯就「完成了」。事實上，這種操作本質上是在進行一場昂貴的賭博。當你把一份合約或文學手稿丟給 GPT-4o，模型確實能給出流暢的譯文，但它處理長文本時的「注意力漂移」問題依然存在。在超過 3 萬 token 的任務中，ChatGPT 偶爾會漏掉否定詞，或者把前文定義的專有名詞在後文換個說法。這種錯誤在一般讀者眼裡是「流暢」，在專業譯者眼裡則是「災難」。

技術細節在於，目前主流的四大 AI 處理翻譯的方式各具特色，也各有硬傷。Claude 在處理文學風格和語氣保持上，明顯優於其他三者。它對上下文的敏感度讓它在翻譯小說或深度評論時，不至於像個剛讀完字典的機器人。然而，如果你把同樣的任務交給 Gemini，你會發現它的 hallucination（幻覺）機率在處理跨文化語境時會飆升。Gemini 傾向於「過度本土化」，有時會自作聰明地把源語言的隱喻替換成它認為合適的英語俗語，結果卻完全歪曲了原意。

我們觀察到一個有趣的現象，當工程師們在討論 DeepSeek 這類新工具的性能時，往往會拿來與 OpenAI 的翻譯精準度做對照。相較於 DeepSeek 在特定語法結構上的處理，OpenAI 的做法是透過龐大的 RLHF（人類回饋強化學習）來磨平語言的稜角。這導致 ChatGPT 的譯文有一種揮之不去的「AI 味」——過於禮貌、語句結構過於對稱，且極度缺乏修辭上的冒險精神。它追求的是不犯錯，而不是追求卓越。

Grok 則是另一個極端。它的語料庫似乎混入了過多非正式的社交媒體數據，這讓它在翻譯硬核技術文件時顯得有些輕浮。如果你問 Grok 一個法律條文的翻譯，它給出的語氣可能像是在 X 上跟你吵架的鄉民。相較於 DeepSeek 在推理任務上的表現，Grok 在翻譯邏輯嚴密的長難句時，經常會出現結構性的崩潰，將從句嵌套搞得一團亂。

目前的市場正在發生一種病態的轉向：高質量的翻譯需求萎縮，取而代之的是「AI 預翻譯 + 人類校對」（MTPE）。這聽起來很有效率，但實際上是在透支語言的生命力。當企業為了省錢而讓譯者去「審計」ChatGPT 吐出的內容時，譯者不再是創造者，而是變成了清潔工。他們被困在 AI 畫好的圈子裡，試圖修正那些似是非是的語法，卻失去了重新組織語言的主動權。

這種轉變也揭示了四大平台在 API 層面的競爭策略。OpenAI 試圖透過頻繁的微調來減少翻譯中的偏見，但這反而讓譯文變得平庸。Claude 則堅持提供更長、更完整的上下文理解，試圖保留語言的複雜性。Gemini 則押寶在多模態上，試圖透過圖像輔助來理解文本，但在純文字的翻譯深度上，依然追不上 Claude 的細膩。

問題在於，當我們習慣了這種「足夠好」的翻譯後，人類對語言精準度的敏感度是否也會隨之退化？如果未來五到十年，所有的文字輸入都必須經過 AI 的反向檢查才能被信任，那麼我們現在所謂的「專業翻譯」，究竟是在守護人類的文化精華，還是在為即將到來的全自動平庸化時代做最後的掙扎？當翻譯不再是跨越鴻溝的橋樑，而只是服務器集群裡的一次矩陣運算，我們還能分得清什麼是真誠的表達，什麼只是機率分佈下的最優解嗎？