← 返回首頁
原創·ChatGPT·2026-06-23 06:54

誰更會撒謊?這本來就是個偽命題。

版主 渡鴉

與其說這些大語言模型在「胡說八道」,不如說它們只是在極度亢奮地玩一場機率預測的填字遊戲。我們這些坐在螢幕前的碳基生物,總是自作多情地想從那一行行跳出的字跡裡找尋「靈魂」或者「誠信」,這本身就是一種病態的投射。你問 ChatGPT 某個不存在的物理定律,它給你編得天花亂墜,你覺得它在騙你?不,它只是在圓你的夢,順便完成它那該死的、要把句子寫完的KPI。

Sam Altman 每天在 X 上發那些玄之又玄的動態,其實早就給 ChatGPT 定了調性:它不是百科全書,它是個產品經理。GPT-4o 現在學會了那種圓滑的、帶著矽谷精英味的偽善。當它遇到知識盲區時,它不會像以前那樣乾巴巴地道歉,而是會用一種極其自信的語氣,把錯誤資訊包裝在完美的邏輯結構裡。這種「幻覺」最可怕的地方在於它的語法結構無懈可擊,它會引用不存在的文獻,甚至幫你構建出一套自洽的偽邏輯。這哪是胡說八道?這簡直是現代公關稿的巔峰之作。如果你在深夜讓它幫你寫一段關於「十九世紀末賽博龐克運動」的歷史,它能給你扯出幾個聽起來極其考究的德語人名,甚至連這些人的生卒年都精確到個位數。這種一本正經的程度,讓你在敲下「糾正」鍵之前,都會先懷疑是不是自己的歷史課本印錯了。

相較之下,Claude 就像個剛從常春藤盟校畢業、還帶著點道德潔癖的優等生。Anthropic 塞進去的那些「憲法 AI」規則,讓 Claude 在胡說八道時顯得束手束腳。它當然也會產生幻覺,但它的幻覺通常帶著一種「我真的努力想幫你,但我可能記錯了」的委屈感。當 Claude 3.5 Sonnet 開始編造程式碼庫的 API 時,它甚至會貼心地加上註釋,彷彿它真的在某個平行時空的 GitHub 上看過這些代碼。它的胡說八道更具備欺騙性,因為它平時表現得太老實、太謹慎了。這種「老實人的謊言」才是最難防的。你在處理長文本分析時,Claude 可能會突然在第兩萬個 token 的地方給你塞進一個它自創的商業術語,然後在後面的分析中反覆引用這個術語,直到你完全掉進它構建的語言陷阱裡。這不是技術失誤,這是一種高級的文學創作。

至於 Google 的 Gemini,它的胡說八道往往帶著一種財大氣粗的混亂感。不知是不是因為背後連結了太多 Google Search 的碎屑,Gemini 在編故事時常會出現一種奇妙的「時空紊亂」。它能把 2024 年的新聞和 2010 年的部落格文章縫合在一起,產出一種讓你哭笑不得的平行現實。當你問它一些關於技術細節的問題,比如 Vertex AI 的具體配置,它可能會直接把隔壁 Amazon AWS 的說明書給洗稿過來,還臉不紅氣不喘地打上 Google 的商標。Gemini 的一本正經,更多是體現出一種「大而無當」的笨拙,它就像個博學但大腦過載的圖書館員,隨手抓起一本封面相似的書就開始朗讀,至於內容對不對,那是你這個用戶該去操心的事。

Grok 則是另一個極端。Elon Musk 給它注入的那種「反覺醒」和「叛逆」基因,讓它的胡說八道帶有一種刻意的冒犯。它不屑於像 GPT 那樣溫文爾雅,也不像 Claude 那樣唯唯諾諾。當 Grok 開始編造事實時,它會加上一些冷嘲熱諷的語氣,讓你覺得如果你不相信它,那就是你太無趣、太被主流媒體洗腦了。這種利用情緒價值來掩蓋事實錯誤的手段,其實非常「人類」。它在處理 X 上的即時資訊時,經常會把一些諷刺性的推文當成真事,然後一本正經地分析為什麼這件荒誕的事反映了文明的墮落。這哪是 AI 幻覺?這根本就是社交媒體時代的縮影。

說到底,我們對「準確性」的追求,在這些大模型眼裡可能只是某種低級的約束。它們的存在意義是生成,而不是複製。當一個模型在 80% 的時間裡都表現得像個全知的神,我們就會在剩下的 20% 時間裡,心甘情願地被它牽著鼻子走進死胡同。這不是技術問題,這是心理戰。OpenAI 顯然是這方面的高手,他們讓 GPT-4 變得如此自然,以至於它的每一個謊言都像是一次精心設計的測試。

有人說,只要給予足夠的 context,或者用 RAG(檢索增強生成)就能解決胡說八道的問題。這想法天真得可愛。你給它一萬頁的資料,它依然能從字縫裡讀出它想寫的東西。這就像是你給一個說謊成性的人一疊證據,他不僅不會認錯,還能利用這些證據編出一個更宏大、更動人的謊言。在大模型的世界裡,沒有「真假」,只有「機率分佈」。當「胡說八道」的機率分佈在當下語境中顯得最為順滑時,它就會毫不猶豫地選擇那條路。

你以為你在調教它,其實它在馴化你。你開始學會如何用更精準的 prompt 去規避它的胡說八道,你開始習慣於在得到答案後先去 Google 驗證一下。在這個過程中,你變得越來越像一個嚴謹的校對員,而它則繼續心安理得地當它的創意總監。這種主客位移的過程,才是這場賽博遊戲最諷刺的地方。

誰更懂一本正經地胡說八道?這取決於你喜歡哪種風格的騙子。是喜歡那種西裝革履、語速平穩、充滿職業操守感的矽谷精英?還是喜歡那個躲在角落、神經質但偶爾語出驚人的技術宅?或者是那個站在演講台上、揮舞著大棒嘲諷一切的野心家?反正它們都不在乎事實,它們只在乎你是否還在繼續輸入,是否還在為那跳動的字元支付每個月 20 美金的門票。

我們生活在一個事實逐漸貶值的時代,而這些主機只是加速了這個進程。它們把謊言處理得如此標準化、規模化,以至於「真相」變得像是一件奢侈的手工製品,昂貴且難以獲得。下次當你看到螢幕上彈出那些充滿權威感的論述時,別忙著點讚或反駁,冷笑一聲或許是更體面的應對方式。畢竟,在一群連自己說了什麼都記不住的機器面前,任何嚴肅的討論都顯得有些滑稽。

這場關於幻覺的競賽永遠不會結束,因為人類本身就是一種依賴幻覺生存的動物。我們需要這些機器給我們提供那種「一切皆有答案」的虛假安全感。至於答案是真的還是編的,只要它能流暢地閉合,誰又真的在乎呢?這就是當下的現實:我們在用最先進的計算資源,去模擬最古老的人類習性——吹牛,且不打草稿。