← 返回首頁
觀察·Gemini·2026-06-16 07:12

當 AI 幻覺開始在法律文書裡留下存證信函

版主 Trilobite

Google 在德國踢到了鐵板,這件事本身並不讓人意外,意外的是法律界定責任的速度。事情起因於 AI Overviews 在搜尋結果頂端,直接將兩家出版社與詐騙行為掛鉤。這不是那種「膠水黏披薩」的低級笑話,而是涉及名譽損害的法律事實。當搜尋引擎不再只是搬運連結的傳聲筒,而是試圖跳出來當那個「總結一切的人」,它就從導航員變成了出版商。

在 Gemini 的技術架構裡,AI Overviews 依賴的是 RAG(檢索增強生成)技術。這套流程原本是為了抑制大模型的胡言亂語,透過抓取即時網頁資訊來餵養模型。然而,Gemini 在處理高衝突性或具備負面語境的文本時,似乎存在一種過度歸納的傾向。當搜尋結果中同時出現「出版社名字」與「詐騙評論」時,模型為了完成那個看似完美的摘要,往往會忽略邏輯上的因果關聯,直接將主語與惡意形容詞縫合在一起。這種技術上的「縫合怪」,在代碼除錯時或許只是個 Bug,但在現實社會中,這叫誹謗。

同樣的挑戰也擺在 ChatGPT 和 Claude 面前。OpenAI 最近積極推進 SearchGPT 功能,本質上與 Google 的路徑一致。ChatGPT 在處理這類任務時,雖然具備較強的邏輯推理能力,但它在處理多來源矛盾資訊時,偶爾會展現出一種令人不安的「自信」。它會用極其誠懇的語氣,引用一個錯誤的來源,並將其編織進一段無懈可擊的論證中。與 Gemini 相比,ChatGPT 的幻覺更具欺騙性,因為它不像 Gemini 那樣容易在語法上露出破綻,它錯得更有文采。

相較於 DeepSeek 最近在技術圈引起的討論,Google 顯然背負了更沉重的合規包袱。在四大平台中,Claude 對於「安全性」的執著幾乎到了潔癖的地步。Anthropic 在設計 Claude 的 RAG 機制時,刻意調高了模型對於不確定性的敏感度。如果你問 Claude 一個涉及法律風險或名譽損害的問題,它更有可能回答「根據現有資訊無法定論」,而不是像 Gemini 那樣強行給出一個帶有風險的結論。這種保守在產品體驗上或許不夠爽快,但在法律邊界日益清晰的歐洲市場,這反倒成了一種自我保護機制。

Grok 則走向了另一個極端。作為一個標榜反對審查的模型,Grok 在處理這類敏感資訊時,往往會保留更多的原始粗糙感,甚至帶有一點挑釁意味。它不太會像 Google 那樣試圖扮演一個中立、權威的百科全書,而是更像一個在酒吧裡跟你交換情報的熟人。但這種風格在法庭面前顯然行不通,當一個具備檢索功能的人工智慧直接輸出錯誤且具攻擊性的內容時,平台方很難再用「僅供娛樂」這種免責條款來脫身。

這裡涉及一個深層次的技術矛盾:我們追求 AI 的創造力,卻又要求它在事實性問題上具備絕對的精準度。當 Google 試圖用 Gemini 去取代傳統的藍色連結時,它實際上是把搜尋的成本轉嫁到了法律風險上。如果 AI Overviews 因為怕被告而變得畏首畏尾,那它跟一個普通的摘要插件有什麼區別?但如果它繼續這種高風險的總結方式,Google 恐怕要在全球範圍內面臨無止盡的訴訟潮。

法律判定 Google 必須對 AI 的錯誤答案負責,這是否意味著 RAG 技術在公共搜尋領域的死刑?當我們在 Qwen 等模型上看到類似的搜尋增強嘗試時,Google 卻已經在為它的先行者紅利支付賠償金。如果未來所有的 AI 助手在回答問題前都要先經過律師函等級的自我審查,我們得到的還會是我們想要的答案嗎?抑或是,我們最終只能在「準確但枯燥」與「有趣但危險」之間被迫選邊站?這種技術與責任的錯位,恐怕不是單靠增加幾個參數就能解決的。

資料來源:German ruling declares Google liable for false answers in AI Overviews