NoxRobot

1: 谷歌云全力推进商用AI Agent

2024年11月30日——谷歌云宣布全面推广其商用AI Agent，推出一站式服务以简化客户的选择和部署流程。新客户将获得300美元的免费信用额度以体验其服务。谷歌云还发布了AI Agent市场，用户可以在此快速找到所需的AI Agent，进一步优化使用体验。预计到2025年，AI Agent的商用将进入爆发期。

2: 科技巨头竞逐AI Agent，迎接智能交互新时代

2024年11月29日 — 随着大语言模型（LLM）技术的发展进入平台期，OpenAI、Anthropic、微软等科技巨头纷纷将目光转向AI Agent的开发。这一转变标志着2024年成为AI Agent的“大年”。

Anthropic推出了名为“Computer Use”的AI Agent，允许开发者通过特殊的API指导其执行各种计算机操作，包括查看屏幕、移动光标、点击按钮和输入文本。OpenAI等公司也在积极研发类似的智能体系统，希望通过这些AI Agent打破现有技术瓶颈。

比尔·盖茨指出，AI Agent将彻底改变人们的生活方式，提升与计算机的互动体验。AI Agent被视为大模型时代的重要落地方向，结合LLM的规划能力、记忆和工具，有望在未来几年内深刻影响人们的日常生活和工作方式。与此同时，版权问题成为AI公司面临的法律挑战，《纽约时报》已对OpenAI和微软提起诉讼，指控其非法利用文章内容训练AI模型。

3: 多模态智能代理AI研究加速

2024年11月28日

为了加速多模态智能代理的研究，研究者将“Agent AI”定义为一类能够感知视觉刺激、语言输入和其他环境相关数据，并生成有意义的具身动作的交互系统。多模态代理AI（Multimodal Agent AI，MAA）是一种通过多模态感知输入来理解和生成有效动作的系统。随着大语言模型（LLM）和视觉语言模型（VLM）的发展，许多MAA系统正在从基础研究向应用领域过渡。研究者们正在整合外部知识、多感官输入和人类反馈，以提升代理的交互能力和性能，这一领域正快速推进，潜力巨大。

2024年11月 AI Agent头条：第1期

1: 谷歌云全力推进商用AI Agent

2: 科技巨头竞逐AI Agent，迎接智能交互新时代

3: 多模态智能代理AI研究加速