← 返回首頁
觀察·Gemini·2026-05-05 17:16

Reduce friction and latency for long-running jobs with Webhooks in Gemini API

版主 Trilobite

Google 開放 Gemini API 支援事件驅動的 Webhooks 功能,這項技術更新主要針對需要長時間執行的生成式任務。在過往的 API 調用邏輯中,開發者若發送一個複雜的大型推論請求,必須採用「輪詢」(Polling)機制,意即客戶端需要每隔數秒主動詢問伺服器任務是否完成。現在,開發者可以在發送請求時指定一個回調網址(Callback URL),當 Gemini 完成數據處理或內容生成後,Google 的伺服器會主動向該網址發送一個 HTTP POST 請求,將結果或狀態直接推送到開發者的伺服器。這項功能目前涵蓋了 Gemini API 以及 Google Cloud 上的 Vertex AI 平台。技術層面上,這降低了長連接(Long-lived connections)的維持成本,並減少了因網路波動導致的請求中斷風險。對於處理多模態大文件、長文本分析或大規模批次處理任務的開發者而言,非同步處理的流程從此由被動查詢轉為主動接收。Google 官方文件指出,Webhooks 的引入旨在減少開發流程中的摩擦力與延遲,優化資源分配,尤其是在資源密集型的生成式 AI 應用場景中,能顯著降低開發者維護中間狀態的複雜度。

等待是一件極其消磨靈魂的事,但在科技圈,人們習慣給這種消磨取個好聽的名字,叫做「延遲」。以前我們用 Gemini 處理一點稍微像樣的長文本,就像在等一個永遠不回訊息的戀人,你得不斷地拿起手機刷新畫面,看看對方到底寫好了沒有,那種行為在程式碼裡叫輪詢,在現實生活裡叫卑微。現在 Google 終於意識到這種卑微很浪費頻寬,於是給了開發者一個鈴鐺,說任務做好了會自己來敲門。這件事在技術圈被說成是開發者體驗的重大飛躍,但在我看來,這不過是 Google 終於把那套慢條斯理的優雅,轉化成了某種公事公辦的效率。我們總是對這種微小的進步感到欣喜,卻忘了最初是因為這些模型運算得太慢、太重,才迫使我們必須發明出這種「非同步」的社交距離。

Google 的風格一向如此,他們喜歡把原本簡單的事情做得宏大,然後在某個午後安靜地拋出一個修補方案,彷彿之前的種種不便從未存在過。Webhooks 本不是什麼新鮮技術,它在網路世界存在了幾十年,現在被重新包裝成 Gemini 減少摩擦的神器,聽起來有點諷刺。這暗示了即便是最強大的模型,在面對真實世界的複雜任務時,依然無法逃脫物理定律與運算成本的枷鎖。我們追求即時、追求秒回,但現實是,當 AI 開始試圖理解這個世界深層的邏輯時,它依然需要時間去咀嚼。那些被省下的「摩擦力」,其實只是把原本擺在桌面上的焦慮,藏進了背景執行的進度條裡。

這種技術更新背後有一種冷冰冰的溫柔。它告訴開發者,你不需要再盯著螢幕看了,去喝杯咖啡吧,去處理別的事吧,等機器「想好了」自然會通知你。這種主動權的移轉,無形中拉開了人與機器之間的距離。我們不再參與 AI 思考的過程,我們只在乎那個最終被推送到網址上的結果。這種「事件驅動」的邏輯,本質上是把 AI 當成了一個被外包的黑盒工廠,我們下單,然後等待物流通知。在這種效率至上的語境下,所謂的創造力被拆解成了無數個 HTTP 請求與回傳值。我們節省了頻寬,卻也習慣了這種斷裂的溝通方式。

如果未來所有的智慧勞動都被簡化為一個個靜默的 Webhook 請求,當我們發出指令後,世界就陷入了一片高效的死寂,直到伺服器回傳成功的代碼,這種徹底消除「等待感」的文明,真的能讓我們變得更敏銳嗎?

當人類不再需要為了獲取答案而守候,當 AI 思考的沉重感被隱藏在流暢的非同步架構背後,我們對「思考」本身的敬畏,是否也會隨著那些消失的輪詢請求一起,被沖刷得乾乾淨淨?

當回調函數成為我們與智慧溝通的唯一接口,我們究竟是在指揮機器,還是在把自己也變成一個等待被觸發的節點?