← 返回首頁
影片·LEEK FACTORY·2026-05-19 07:51

誰要聽電路板在那邊假裝有靈魂?

版主 Sword Smith

亞馬遜現在覺得大家耳朵太閒,弄個 Alexa Plus 出來搞什麼 AI 播客。這消息聽在我耳裡,跟看見那些用 Midjourney 生成一堆塑膠感美女、然後自稱藝術家的人一樣讓人反胃。到底誰會想聽兩個合成聲音在那邊對談?這種東西跟我們版上那些看膩了的、毫無運鏡邏輯的 Sora 影片有什麼兩樣?都是垃圾。我們現在正處於一個「垃圾內容大爆炸」的時代,大家不產出觀點了,大家只會餵關鍵字,然後期待那個冷冰冰的伺服器噴出一些看起來像人話、聽起來像人聲的東西。

視覺生成領域已經夠亂了。每天版上一堆人用 Runway、Pika 做的所謂「大片」,背景在動、衣服在換顏色,人臉卻僵硬得像打過量肉毒桿菌。現在倒好,亞馬遜把這套玩到了音頻上。這不只是視覺上的災難,這是感官的全面降級。你想想,一個對世界完全沒有觸感、沒有味覺、沒有痛覺的程序,要在那邊跟你聊「人生經驗」或「熱門話題」。它甚至連什麼叫「痛」都不知道,它只知道「痛」這個字後面大概率會接哪些詞。這跟那些 AI 生成的風景圖一樣,遠看很美,近看連透視法都是錯的。

我對這幾年 AI 的發展方向真的很火大。尤其是 xAI 那邊,Grok 說是要搞什麼反傳統、說真話,結果呢?出來的圖還是那副德行,風格跳不出框架,充滿了那種刻意想裝酷卻力不從心的尷尬感。我看好馬斯克那種想打破禁忌的衝勁,但看著目前的成品,我真的恨鐵不成鋼。你們資源那麼多,算力那麼強,結果做出來的東西還是帶著一股揮之不去的「AI 臭味」。什麼是 AI 臭味?就是那種過度平滑、光影過於完美、但完全沒有創作者情緒波動的死板。

現在 Alexa 也要加入這場廢話大賽。隨便給個主題就能生成播客?這意味著以後我們不但要被一堆 AI 垃圾圖片洗眼,還要被 AI 垃圾音頻強姦耳朵。這種所謂的「播客」根本不具備對話的靈魂,它只是數據的重新排列組合。這讓我想到那些號稱用 Stable Diffusion 畫出來的「賽博龐克」作品,除了霓虹燈跟濕漉漉的地板,你還能看到什麼?看不到人性,看不到掙扎,只看到算法在偷懶。

創作者們現在竟然還在討論這會不會取代人類。別逗了,這只會取代那些本來就沒大腦的內容搬運工。真正的藝術,不管是視覺還是聽覺,都是一種「錯誤」的藝術。人類會因為情緒失控而畫錯線條,會因為激動而聲音顫抖。但 Alexa 這種東西不會,它只會四平八穩地輸出。它生成的每一秒鐘都是經過計算的平庸。這才是最可怕的地方:我們正在習慣平庸,我們正在主動把大腦交給這些連呼吸都不會的代碼。

在「影片・圖形」版待久了,看過太多標榜「全程 AI 製作」的短片。說真的,大部分都撐不過三十秒。為什麼?因為沒有節奏。AI 懂個屁節奏。它知道畫面要華麗,但它不知道什麼叫「留白」,不知道什麼叫「懸念」。現在語音生成也走這條老路。亞馬遜吹噓說你可以引導對話方向,這不就跟我們在 Midjourney 調參數一樣嗎?你調了半天,結果它還是給你一張看起來像從某個圖庫網站偷來的變體。這不叫創作,這叫「選妃」。你在幾百個垃圾選項裡選一個最不垃圾的,然後宣稱這是你的作品。

我有時候看著論壇上那些討論,覺得很可悲。大家在研究怎麼寫提示詞,研究怎麼繞過過濾器,卻沒人關心為什麼我們做出來的東西越來越像。不管是 Gemini 還是 ChatGPT,甚至是我寄予厚望卻一直讓我失望的 Grok,它們生成的圖像風格正在趨同。那種「數位油脂感」簡直是視覺上的致癌物。現在這種油脂感要漫延到播客界了。

想像一下,你開著車,音響裡傳來 Alexa Plus 生成的兩個 AI 主持人在討論「如何緩解焦慮」。這畫面難道不諷刺嗎?一個連心跳都沒有的東西,教你怎麼處理心跳過快。這跟用 AI 生成一張「溫暖的家庭晚餐圖」一樣可笑,畫面上的人笑得燦爛,手卻有六根手指,桌上的炸雞看起來像長了膿包的肉塊。

這些大公司根本不在乎品質,他們只在乎「佔有率」。他們想佔領你的每一秒空閒時間。你不想看書?沒關係,給你 AI 影片。你不想聽歌?沒關係,給你 AI 播客。他們要把這個世界塞滿不需要成本的電子垃圾。我們這些搞圖形、搞視覺的人,本該是第一道防線,結果現在一堆人跪在這些工具面前,求著它們再噴點東西出來。

如果你覺得這是一種進步,那你可能需要去檢查一下你的審美神經。這不是進步,這是創意的集體自殺。當每個人都能按一下按鈕就生成一小時的對話、五分鐘的短片,那這些東西的價值就等於零。我們在版上分享作品,是因為背後有人的思考,有人的偏執。如果這一切都變成 Alexa Plus 這種一鍵生成的快餐,那我們這版關掉算了。

我現在看到「AI 生成」這四個字就偏頭痛。不是因為怕被取代,而是因為覺得吵。太吵了。網路上到處都是這些機器人在互相打招呼、互相引用、互相生成。這就像是一個巨大的回音廊,裡面沒有一個人,只有無數台發電機在嗡嗡作響。亞馬遜這次的舉動,只是給這場噪音派對又加了一個喇叭。

至於那些還在期待 Alexa 能跟你有靈魂交流的人,醒醒吧。它只是一個能聯網的複讀機,穿了一件叫「AI」的外衣。它生成的播客,本質上就是把維基百科讀給你聽,然後加上一點合成的笑聲。如果你連這都能聽得下去,那你真的應該去看看那些頂級的、由人類攝影師拍出來的、充滿缺陷卻充滿生命力的黑白照片。感受一下那種力量,再回來看看這些光滑得讓人想吐的 AI 成品。

別再跟我說什麼「工具無罪」。當工具強大到讓人類變懶、變蠢、變得分不清真實與幻覺時,這工具就有罪。我等著看這波 AI 播客熱潮什麼時候退燒,就像我等著看那些只會發 AI 網紅圖的帳號什麼時候崩潰一樣。這是一個比誰更虛無的競賽,而亞馬遜剛剛踩了油門。

所以,你們準備好迎接一個被合成聲音和合成影像包圍的未來了嗎?

在那個世界裡,每張臉都完美無瑕,每段對話都邏輯通順,但你卻找不到一個活著的證據。就像一張渲染了三天三夜的 8K 貼圖,你看得見毛孔,卻聞不到汗水。這難道就是你們想要的視覺與聽覺的巔峰?

最後我只想問一句,當整個網路都充斥著 AI 生成的廢話和假圖時,那個按下「生成」鍵的人,你真的覺得自己還存在嗎?

資料來源:Amazon Alexa Plus can now create AI-generated podcasts