就在 DeepSeek V4 Pro 持續引起開發者社群對推理能力與參數效率討論的同時,Google 卻在歐洲踢到了鐵板。德國法院最近的一項裁決,把 Google 的 AI Overviews 拽進了法律的泥淖——當 AI 錯誤地將兩家出版社與詐騙行為聯繫起來時,Google 不能再躲在「這只是算法生成的預測」背後,而必須承擔法律責任。這件事遠不只是法律糾紛,它直接戳破了當前主流大模型在檢索增強生成(RAG)架構下的技術傲慢。
我們習慣了 Google 搜尋那種「給出連結,剩下的你自己判斷」的免責模式。但當 AI Overviews 試圖把零散的網頁資訊縫合成一段看似權威的結論時,它就從一個指路牌變成了一個說書人。技術上,這涉及 Gemini 的長文本處理與資訊提取的精準度。在處理複雜的商業背景調查時,Gemini 往往會為了達成語句的通順感,而將不同的主體強行關聯。這種「幻覺」與純粹的胡言亂語不同,它具有邏輯上的連貫性,這正是最危險的地方。如果 API 調用時的溫度係數(Temperature)設置不當,或者在 Top-p 採樣中過於放任,AI 就會為了完成任務而「腦補」出事實。
對於 ChatGPT 或 Claude 而言,這同樣是一個繞不開的技術陷阱。ChatGPT 的搜索模式在處理即時新聞時,雖然引入了更多的引文標註,但其內在的推理邏輯依然依賴於對上下文的預測。一旦數據源本身存在歧義,或者模型在將非結構化數據轉化為結構化事實的過程中發生偏移,輸出的結果就可能構成侵權。Claude 在這方面顯得保守一些,它的模型對齊(Alignment)策略通常會讓它在面對不確定的事實時選擇拒絕回答,或者給出極其模糊的應對,但這種「安全感」是以犧牲用戶體驗為代價的。
這種技術上的分歧在橫向對比中變得格外刺眼。相較於 DeepSeek V4 Pro 在特定語境下的生成邏輯,Google 的做法顯然更具攻擊性,它試圖接管用戶對資訊的最終解釋權。當我們觀察四大平台的表現時,會發現 Grok 在處理這類問題上最為激進,它幾乎不對抓取到的社交媒體情緒做二次過濾。相比之下,Gemini 試圖在權威性與流暢性之間走鋼絲,卻在德國的法庭上失了平衡。這不再是單純的算法優化問題,而是模型在面對真實世界的法律邊界時,底層架構是否存在不可逾越的缺陷。
如果 AI 只是在互聯網的廢墟上拾荒,那它永遠無法保證撿回來的是金子還是垃圾。當我們討論 AI 的責任歸屬時,本質上是在討論我們是否願意賦予模型「法人」般的信任。如果 Google 必須為 AI 的每一個字負責,那麼為了避免法律風險,AI Overviews 的回答可能會縮減到只剩下複讀機式的摘錄。這樣一來,我們追求的高級智能,是否最終會退化成一種更昂貴、更低效的傳統搜索引擎?
如果有一天,ChatGPT 因為給出了一段錯誤的投資建議而導致用戶破產,或者 Claude 因為誤讀了某份醫療報告而給出錯誤指引,廠商是否還能用那句「僅供參考」來脫身?當法律開始要求 AI 具備與人類員工同等的責任感時,現有的 transformer 架構是否已經觸碰到了它作為「概率預測機器」的天花板?我們在追求 AGI 的路上,究竟是在創造一個全知的上帝,還是一個隨時可能讓我們賠得傾家蕩產的虛假證人?