跳至內容

AI Agent的最新發展

智慧代理 / 智能代理 / agentic AI

下面是一篇根據最近一個月(主要是 2025 年 9 月底至 10 月中旬),談近期 AI Agent(智慧代理 / 智能代理 / agentic AI)的最新發展。由AI收集整理撰寫,並經筆者進行局部調整,以公開資訊為參考基礎。

引言:AI Agent 春秋再起

近年來,「AI Agent」(有時被稱為 agentic AI、智能代理、行為代理等)成為 AI 領域備受關注的話題。不同於傳統的聊天機器人或語言模型,AI Agent 強調的是能自主規劃、執行多步操作、與工具/外部系統互動的能力。2025 年下半年起,這個領域尤其進入一波加速期:從開源規格標準、跨平台代理建構工具,到代理的演化與自治,推動整體技術與應用生態持續拓展。

以下分幾個主題,說明最近一個月值得關注的幾大動態與趨勢。

一、Open Agent Specification:跨框架代理的統一語言

2025 年 10 月初,一份名為 Open Agent Specification (Agent Spec) 的技術報告正式發表,提出了一種宣告式的代理規格語言,旨在讓不同框架下的 AI Agent 具有可攜性與互操作性。(arXiv)

為什麼這件事重要?

  • 標準化互操作性: 現階段,開發者常面對不同 agent 平台(A、B、C)之間規格不一、工具接口差異大的問題。Agent Spec 若能被廣泛採納,就可能成為一種中立層,讓一個代理定義能在不同環境中執行。
  • 加速開發效率: 有了統一規格,開發者可以撰寫一次「企劃或流程」,然後針對不同 agent 引擎做映射,省去重複建構邏輯的時間。
  • 生態整合可能: Agent Spec 可作為「代理商店(agent marketplace)」的橋樑,讓第三方代理能在多種平台間移植與運行。

不過要注意的是,目前 Agent Spec 還屬技術報告階段,尚未看到大規模業界採用案例或標準化組織背書。因此,未來觀察重點在於它是否能跨入主要 agent 平台的工具鏈中。

二、主要廠商動作:平台、工具與能力競賽

過去一月,以 Google、OpenAI、Amazon 等為代表的科技巨頭,都在 agent 領域進行新的布局。

1. OpenAI Agent Kit:從原型到生產的工具鏈

在 OpenAI 的 DevDay 2025 活動中,OpenAI 公布了 Agent Kit,一整套從設計、測試到部署 AI 代理的工具套件。(The Economic Times)

這代表 OpenAI 希望降低企業或開發者上手 agent 的門檻。以前要把一個 agent 從概念做到穩定運行,往往要自建很多中間件、接口、調度模型等。Agent Kit 的目標,就是把這些基礎架構模組化、標準化。

同時,OpenAI 也在這次發布中更新了 Codex 模型,進一步強化其在程式碼生成與工具接口管理上的能力,這對 agent 的構建能力非常關鍵。(The Economic Times)

2. Google:從瀏覽器互動到企業平台

Google 在此期間也推出了幾項重要進展:

  • Gemini 2.5 Computer Use:這款模型能以「像人使用瀏覽器一樣」的方式來操作網頁,例如填寫表單、點擊、拖曳等,目前支援 13 種預定義操作。(The Verge)
  • Gemini Enterprise / 取代 Agentspace:Google Cloud 正式將其內部 agent 平台從 Agentspace 升級為 Gemini Enterprise,將 Gemini 模型與低代碼介面整合,讓企業員工(甚至非程式人員)也能建立、使用客製化代理。(Android Central)
  • Project Mariner:這是一項仍在持續整合中的研究原型,作為 Google Agent 系列中讓代理能「理解 UI 並操作網頁」的基底之一。(維基百科)

Google 的策略看似在於:從前端瀏覽器互動出發,逐步深化到企業應用場景與低代碼平臺,使 agent 能在多個層級中(從 UI 到內部系統)都具備操作能力。

3. Amazon Quick Suite:快速搭建企業 Agent 的平台

另一邊,Amazon 在 AWS 上推出 Quick Suite,定位為企業快速建立 agent 的整體平台。該平台整合企業內部資料源(如 S3、Redshift)、AWS 工具,以及超過 1000 個第三方應用。(TechRadar)

其中包含子模組如 Quick Sight(資料可視化)、Quick Research、Quick Flows、自動化流程等,讓 agent 不只是單純的指令回應,而能在多系統之間調度任務。(TechRadar)

這種平台化策略意味著:AWS 想要成為企業 agent 構建與部署的基礎設施提供者之一。

4. Adobe Agent Composer:行銷與客服 Agent 工具

在行銷與消費者體驗領域,Adobe 宣布了一項名為 Agent Composer 的新工具,讓企業可以根據品牌政策與工作流程定制 agent。(Digital Commerce 360)

目前 Adobe 的 agent 平台已推出六款「開箱即用」代理,涵蓋受眾建模、旅程規劃、A/B 測試、數據洞察、站點優化與產品支援等功能。未來 Agent Composer 將進一步放權讓企業建立自訂代理邏輯。(Digital Commerce 360)

這反映出代理不僅僅是通用工具,更是企業流程與品牌認同的一部分。

三、性能管控與更新策略:代理也要做 A/B 測試

AI Agent 本質上是複雜系統組合:語言模型、工具調用、外部 API、流程規劃、錯誤處理等等。當底層模型升級、指令策略調整、或工具接入變更時,代理的行為可能會不可預期地偏差。

在這樣背景下,Observability(可觀察性)與 A/B 測試工具成為不可或缺的一環。最近,觀察工具公司 Raindrop 推出了一項名為 Experiments 的新功能,專門針對企業級 AI 代理做 A/B 測試比較,包括模型切換、指令變更、工具差異等所造成的行為與性能差異。(Venturebeat)

舉例來說,透過 Experiments,團隊可以比較代理在模型 v1 與模型 v2 下在同樣任務上的成功率、延遲、錯誤率等關鍵指標。這有助於在升級過程中能有量化依據,而不只是直覺判斷。

這種工具化的升級策略,有助於降低 agent 升級帶來的風險,也使得代理管理更具制度化。

四、自演化代理(Self-Evolving Agent):從靜態走向動態進化

在學術界,最近也有幾項前沿研究提出代理能夠自我演化、自主優化的架構。這代表未來的代理不只是被動執行操作,而可以主動在運作中改善自己。

1. 無線網路中的自演化代理

一篇名為 “From Agentification to Self-Evolving Agentic AI for Wireless Networks” 的論文,提出了將自演化 agent 應用於無線網路(例如基地台重構、天線調整等)的可能性。該研究使用多代理協作、反覆進化、反思機制等技術來讓系統自動優化。實驗中,代理在低空網路(low-altitude wireless networks)中能提升天線性能。(arXiv)

這樣的變化,意味著未來代理不再停留在「人定義→執行」的閉環,而是可能在部署後持續改進自己的規劃、模型與策略。

2. 組織代理間交易與去中心化市場

另一篇觀點文章談到 agent-to-agent 市場(即代理間相互購買服務/數據)的興起,而區塊鏈被視為其中的關鍵基礎設施。作者主張,唯有具備可自我運作資產與交易能力的代理,才能真正達成自治型系統。(CoinDesk)

在這樣的設想中,代理不僅執行任務,也可以作為「實體」在市場中交易、協作、學習、升級。這是一種高度自治、甚至是經濟體級別的 agent 生態系統願景。

五、挑戰與未來觀察重點

儘管近月來 AI Agent 領域動態頻繁,但在落地與擴展之路上仍有不少挑戰與風險,這些也是我們未來持續要關注的地方:

類別 關鍵挑戰 / 風險 說明
安全與可控性 腳本誤動作、工具誤用、極端場景失控 當代理可自動呼叫 API、交易、修改系統設定時,出錯代價會很高。需要政策、沙箱機制、回滾機制等設計。
透明與可解釋性 如何讓代理決策可追蹤、可審計 在企業或高敏感應用中,使用者或監管機構會要求能解釋代理的決策過程。
版本升級風險 模型或工具升級導致行為偏差 正如剛才提到的 A/B 測試機制,是控制這類風險的關鍵手段。
跨平台兼容性 各大代理平台規格不一、工具接口差距大 Open Agent Spec 等標準規範是試圖填補這項缺口,但能否被主流平台接受仍待觀察。
生態市場成熟度 代理商店、交易平台、代理評價機制尚未成熟 要把 agent 做成像 App Store 一樣的市場,還需要解決信任、交易、版權、合規等問題。

基於上述,以下是幾項值得觀察的方向:

  1. Agent Spec 是否能被主流平台採用
    如果 OpenAI、Google、AWS、Anthropic 等都能支援這種規格,那麼跨平台代理將變得更可行。
  2. 自演化代理在真實場域的應用案例
    特別是在硬體、網路、智慧製造、能源管理等領域,能否呈現出比人為調整更好的性能優化。
  3. 代理商店與市場機制的成熟度
    包括代理打包、定價、交易、信評、審核流程等方面是否能達到類似軟體生態系的運作模式。
  4. 代理安全治理與監管策略
    在涉足金融、醫療、基礎設施等高風險場域前,代理必須具備較強的安全、合規與解釋能力。

結語

過去一個月,AI Agent 領域在「工具生態化」、「標準化」、「自演化」等方面皆展現出明顯的發展勢頭。無論是 OpenAI 的 Agent Kit、Google 的瀏覽器互動能力、AWS 的 Quick Suite、Adobe 的 Agent Composer,或是學術界的 Agent Spec 與自演化架構,這些動作共同鋪排出未來 AI Agent 生態逐步成熟的可能路徑。

對於業界與開發者而言,現階段的重點應放在如何在現有平台上穩健構建代理、掌握版本升級風險、建立監控與可解釋機制,以及觀察這些平台與標準是否能真正被業界採納與擴展。


參考資料:

 

Odoo 18 綠界電子發票
導入步驟