當自動化垃圾郵件開始具備同理心的幻覺

在 Hacker News 的求職帖裡翻找機會，本質上是現代版的投石問路，但最近這塊試金石被一種廉價的技術惡意給抹黑了。一位在餐飲自動化領域深耕多年的工程師，在失業六個月、背負債務與生活壓力的邊緣，收到了幾封看似專業、實則由腳本生成的開發服務推廣信。發信者甚至沒讀懂發帖人是在找工作，而非在招標。這種利用 LLM 抓取關鍵字、自動生成開發者畫像並精準投遞的行為，像是在乾涸的枯井旁向口渴的人推銷昂貴的抽水機。這種技術上的「勤奮」其實是極度懶惰的表現，它暴露出當前 AI 應用開發中一種病態的趨勢：為了展示所謂的 Agent 編排能力，不惜將社交禮儀與人類最脆弱的生存需求當作壓力測試的實驗場。

這種行為背後反映的是 RAG（檢索增強生成）與 Agent 框架的濫用。開發者們熱衷於在 GitHub 上展示如何用 Python 或 TypeScript 搭建一套自動化工作流，卻忽略了模型在處理複雜社交語境時的「語義短路」。以 Claude 為例，雖然其在長文本理解與情緒細微差別的捕捉上優於多數模型，但當它被塞進一個只追求轉化率的自動化腳本時，那種克制而理性的語氣反而成了一種偽裝。Claude 能夠寫出極其得體的商務信函，甚至能根據對方的背景調整修辭，但這種「高保真」的擬人化，在求職者眼中卻成了最殘酷的諷刺。你以為對方在認真閱讀你的苦難，實際上那只是模型在計算下一個 token 的機率分佈。

這不僅僅是道德層面的崩壞，更是技術實現上的拙劣。目前的自動化工具往往在向量數據庫檢索階段就出了問題，它們只識別到了「Hospitality」、「Automation」和「Hiring」這些標籤，卻無法識別「Looking for a job」與「Looking for a developer」之間的邏輯鴻溝。ChatGPT 在處理這類多步推理任務時，若沒有經過嚴格的 Few-shot 提示詞約束，極易陷入一種「過度服務」的陷阱，試圖將所有檢索到的對象都轉化為潜在客戶。這種對語義理解的淺嚐輒止，讓所謂的「生產級 AI 系統」變成了數位垃圾的生產線。

相較於 DeepSeek 在特定代碼邏輯處理上的效率，Claude 在處理這類涉及人類情感邊界的任務時，其憲法 AI（Constitutional AI）的框架本應提供一層過濾，但在 API 調用的層面，這層保護色很容易被開發者刻意繞過。同樣的現象在 Gemini 身上也時有發生，儘管 Gemini 擁有極大的上下文窗口，能夠一次性處理整個求職討論串，但其模型內置的合規性檢查往往只針對暴力或仇恨言論，對於這種「禮貌的騷擾」幾乎毫無防備。至於 Grok，其追求的真實與不羈在這種場景下更像是一把雙刃劍，如果缺乏適當的 Prompt 工程，輸出的內容可能比那些偽裝專業的郵件更令人不適。

我們正處於一個非常尷尬的技術節點：我們賦予了 AI 寫作的能力，卻沒有賦予它閉嘴的智慧。開發者們拿著這些強大的模型，像是在繁華的瓷器店裡揮舞大錘。當 Alya 這樣的工具被冠以「女兒」之名，卻在互聯網角落裡對著絕望的人群發送冰冷的營銷郵件時，這已經超出了技術討論的範疇，而是一種賽博空間的異化。在 Qwen 頻繁更新其開源模型能力的當下，我們看到的更多是算力的堆砌，而非對交互本質的思考。這讓人不禁產生一種荒謬的聯想，是否未來的互聯網將充斥著無數個自我陶醉的 Agent，它們互相發送著由高品質 LLM 生成的垃圾郵件，而真正的人類則在這些自動化噪音中被徹底淹沒。

如果一個系統能識別出你的職業背景，卻識別不出你的痛苦，那這種「智能化」的價值究竟在哪裡？當 Claude 或 ChatGPT 被訓練得越來越像人，我們是否也應該反思，那些操控模型的人，是否正變得越來越像一串冷冰冰的指令？當我們優化了 RAG 的檢索精度，提升了 Agent 的執行效率，最終卻只是為了更精準地往別人的傷口上撒鹽，這難道不是一種技術文明的倒退？下一次，當你準備寫一個「自動化開發者拓展腳本」時，是否會考慮在代碼裡加上一行：如果檢索結果包含「失業」或「負債」，請保持沈默？