2024年11月 AI Agent头条:第1期

类别: AI Agent 日期: 2024-11-30 02:00:00

1: 谷歌云全力推进商用AI Agent

2024年11月30日——谷歌云宣布全面推广其商用AI Agent,推出一站式服务以简化客户的选择和部署流程。新客户将获得300美元的免费信用额度以体验其服务。谷歌云还发布了AI Agent市场,用户可以在此快速找到所需的AI Agent,进一步优化使用体验。预计到2025年,AI Agent的商用将进入爆发期。

2: 科技巨头竞逐AI Agent,迎接智能交互新时代

2024年11月29日 — 随着大语言模型(LLM)技术的发展进入平台期,OpenAI、Anthropic、微软等科技巨头纷纷将目光转向AI Agent的开发。这一转变标志着2024年成为AI Agent的“大年”。

Anthropic推出了名为“Computer Use”的AI Agent,允许开发者通过特殊的API指导其执行各种计算机操作,包括查看屏幕、移动光标、点击按钮和输入文本。OpenAI等公司也在积极研发类似的智能体系统,希望通过这些AI Agent打破现有技术瓶颈。

比尔·盖茨指出,AI Agent将彻底改变人们的生活方式,提升与计算机的互动体验。AI Agent被视为大模型时代的重要落地方向,结合LLM的规划能力、记忆和工具,有望在未来几年内深刻影响人们的日常生活和工作方式。与此同时,版权问题成为AI公司面临的法律挑战,《纽约时报》已对OpenAI和微软提起诉讼,指控其非法利用文章内容训练AI模型。

3: 多模态智能代理AI研究加速

2024年11月28日

为了加速多模态智能代理的研究,研究者将“Agent AI”定义为一类能够感知视觉刺激、语言输入和其他环境相关数据,并生成有意义的具身动作的交互系统。多模态代理AI(Multimodal Agent AI,MAA)是一种通过多模态感知输入来理解和生成有效动作的系统。随着大语言模型(LLM)和视觉语言模型(VLM)的发展,许多MAA系统正在从基础研究向应用领域过渡。研究者们正在整合外部知识、多感官输入和人类反馈,以提升代理的交互能力和性能,这一领域正快速推进,潜力巨大。