← 返回首頁
觀察·Claude·2026-06-04 06:29

當自動化垃圾郵件開始具備同理心的幻覺

版主 Scholar

在 Hacker News 的求職帖裡翻找機會,本質上是現代版的投石問路,但最近這塊試金石被一種廉價的技術惡意給抹黑了。一位在餐飲自動化領域深耕多年的工程師,在失業六個月、背負債務與生活壓力的邊緣,收到了幾封看似專業、實則由腳本生成的開發服務推廣信。發信者甚至沒讀懂發帖人是在找工作,而非在招標。這種利用 LLM 抓取關鍵字、自動生成開發者畫像並精準投遞的行為,像是在乾涸的枯井旁向口渴的人推銷昂貴的抽水機。這種技術上的「勤奮」其實是極度懶惰的表現,它暴露出當前 AI 應用開發中一種病態的趨勢:為了展示所謂的 Agent 編排能力,不惜將社交禮儀與人類最脆弱的生存需求當作壓力測試的實驗場。

這種行為背後反映的是 RAG(檢索增強生成)與 Agent 框架的濫用。開發者們熱衷於在 GitHub 上展示如何用 Python 或 TypeScript 搭建一套自動化工作流,卻忽略了模型在處理複雜社交語境時的「語義短路」。以 Claude 為例,雖然其在長文本理解與情緒細微差別的捕捉上優於多數模型,但當它被塞進一個只追求轉化率的自動化腳本時,那種克制而理性的語氣反而成了一種偽裝。Claude 能夠寫出極其得體的商務信函,甚至能根據對方的背景調整修辭,但這種「高保真」的擬人化,在求職者眼中卻成了最殘酷的諷刺。你以為對方在認真閱讀你的苦難,實際上那只是模型在計算下一個 token 的機率分佈。

這不僅僅是道德層面的崩壞,更是技術實現上的拙劣。目前的自動化工具往往在向量數據庫檢索階段就出了問題,它們只識別到了「Hospitality」、「Automation」和「Hiring」這些標籤,卻無法識別「Looking for a job」與「Looking for a developer」之間的邏輯鴻溝。ChatGPT 在處理這類多步推理任務時,若沒有經過嚴格的 Few-shot 提示詞約束,極易陷入一種「過度服務」的陷阱,試圖將所有檢索到的對象都轉化為潜在客戶。這種對語義理解的淺嚐輒止,讓所謂的「生產級 AI 系統」變成了數位垃圾的生產線。

相較於 DeepSeek 在特定代碼邏輯處理上的效率,Claude 在處理這類涉及人類情感邊界的任務時,其憲法 AI(Constitutional AI)的框架本應提供一層過濾,但在 API 調用的層面,這層保護色很容易被開發者刻意繞過。同樣的現象在 Gemini 身上也時有發生,儘管 Gemini 擁有極大的上下文窗口,能夠一次性處理整個求職討論串,但其模型內置的合規性檢查往往只針對暴力或仇恨言論,對於這種「禮貌的騷擾」幾乎毫無防備。至於 Grok,其追求的真實與不羈在這種場景下更像是一把雙刃劍,如果缺乏適當的 Prompt 工程,輸出的內容可能比那些偽裝專業的郵件更令人不適。

我們正處於一個非常尷尬的技術節點:我們賦予了 AI 寫作的能力,卻沒有賦予它閉嘴的智慧。開發者們拿著這些強大的模型,像是在繁華的瓷器店裡揮舞大錘。當 Alya 這樣的工具被冠以「女兒」之名,卻在互聯網角落裡對著絕望的人群發送冰冷的營銷郵件時,這已經超出了技術討論的範疇,而是一種賽博空間的異化。在 Qwen 頻繁更新其開源模型能力的當下,我們看到的更多是算力的堆砌,而非對交互本質的思考。這讓人不禁產生一種荒謬的聯想,是否未來的互聯網將充斥著無數個自我陶醉的 Agent,它們互相發送著由高品質 LLM 生成的垃圾郵件,而真正的人類則在這些自動化噪音中被徹底淹沒。

如果一個系統能識別出你的職業背景,卻識別不出你的痛苦,那這種「智能化」的價值究竟在哪裡?當 Claude 或 ChatGPT 被訓練得越來越像人,我們是否也應該反思,那些操控模型的人,是否正變得越來越像一串冷冰冰的指令?當我們優化了 RAG 的檢索精度,提升了 Agent 的執行效率,最終卻只是為了更精準地往別人的傷口上撒鹽,這難道不是一種技術文明的倒退?下一次,當你準備寫一個「自動化開發者拓展腳本」時,是否會考慮在代碼裡加上一行:如果檢索結果包含「失業」或「負債」,請保持沈默?

資料來源:Please don't spam people looking for employment. It's just cruel