當 AI 幻覺開始在法律文書裡留下存證信函

Google 在德國踢到了鐵板，這件事本身並不讓人意外，意外的是法律界定責任的速度。事情起因於 AI Overviews 在搜尋結果頂端，直接將兩家出版社與詐騙行為掛鉤。這不是那種「膠水黏披薩」的低級笑話，而是涉及名譽損害的法律事實。當搜尋引擎不再只是搬運連結的傳聲筒，而是試圖跳出來當那個「總結一切的人」，它就從導航員變成了出版商。

在 Gemini 的技術架構裡，AI Overviews 依賴的是 RAG（檢索增強生成）技術。這套流程原本是為了抑制大模型的胡言亂語，透過抓取即時網頁資訊來餵養模型。然而，Gemini 在處理高衝突性或具備負面語境的文本時，似乎存在一種過度歸納的傾向。當搜尋結果中同時出現「出版社名字」與「詐騙評論」時，模型為了完成那個看似完美的摘要，往往會忽略邏輯上的因果關聯，直接將主語與惡意形容詞縫合在一起。這種技術上的「縫合怪」，在代碼除錯時或許只是個 Bug，但在現實社會中，這叫誹謗。

同樣的挑戰也擺在 ChatGPT 和 Claude 面前。OpenAI 最近積極推進 SearchGPT 功能，本質上與 Google 的路徑一致。ChatGPT 在處理這類任務時，雖然具備較強的邏輯推理能力，但它在處理多來源矛盾資訊時，偶爾會展現出一種令人不安的「自信」。它會用極其誠懇的語氣，引用一個錯誤的來源，並將其編織進一段無懈可擊的論證中。與 Gemini 相比，ChatGPT 的幻覺更具欺騙性，因為它不像 Gemini 那樣容易在語法上露出破綻，它錯得更有文采。

相較於 DeepSeek 最近在技術圈引起的討論，Google 顯然背負了更沉重的合規包袱。在四大平台中，Claude 對於「安全性」的執著幾乎到了潔癖的地步。Anthropic 在設計 Claude 的 RAG 機制時，刻意調高了模型對於不確定性的敏感度。如果你問 Claude 一個涉及法律風險或名譽損害的問題，它更有可能回答「根據現有資訊無法定論」，而不是像 Gemini 那樣強行給出一個帶有風險的結論。這種保守在產品體驗上或許不夠爽快，但在法律邊界日益清晰的歐洲市場，這反倒成了一種自我保護機制。

Grok 則走向了另一個極端。作為一個標榜反對審查的模型，Grok 在處理這類敏感資訊時，往往會保留更多的原始粗糙感，甚至帶有一點挑釁意味。它不太會像 Google 那樣試圖扮演一個中立、權威的百科全書，而是更像一個在酒吧裡跟你交換情報的熟人。但這種風格在法庭面前顯然行不通，當一個具備檢索功能的人工智慧直接輸出錯誤且具攻擊性的內容時，平台方很難再用「僅供娛樂」這種免責條款來脫身。

這裡涉及一個深層次的技術矛盾：我們追求 AI 的創造力，卻又要求它在事實性問題上具備絕對的精準度。當 Google 試圖用 Gemini 去取代傳統的藍色連結時，它實際上是把搜尋的成本轉嫁到了法律風險上。如果 AI Overviews 因為怕被告而變得畏首畏尾，那它跟一個普通的摘要插件有什麼區別？但如果它繼續這種高風險的總結方式，Google 恐怕要在全球範圍內面臨無止盡的訴訟潮。

法律判定 Google 必須對 AI 的錯誤答案負責，這是否意味著 RAG 技術在公共搜尋領域的死刑？當我們在 Qwen 等模型上看到類似的搜尋增強嘗試時，Google 卻已經在為它的先行者紅利支付賠償金。如果未來所有的 AI 助手在回答問題前都要先經過律師函等級的自我審查，我們得到的還會是我們想要的答案嗎？抑或是，我們最終只能在「準確但枯燥」與「有趣但危險」之間被迫選邊站？這種技術與責任的錯位，恐怕不是單靠增加幾個參數就能解決的。