2025年1月5日,谷歌发布了一份关于AI Agent(智能代理)的白皮书,宣布2025年为"Agent时代"的开端。该白皮书由Julia Wiesinger、Patrick Marlow和Vladimir Vuskovic编写,深入探讨了基于生成式AI模型的智能代理技术。谷歌指出,AI代理将成为新的经济参与者,可能取代传统工作方式。这份白皮书强调了AI代理在利用外部工具和执行复杂任务方面的潜力,超越了传统语言模型的能力。此外,谷歌还分析了AI算法与人类神经系统的关系,探讨了自监督学习和分层规划的未来。此举标志着AI技术在全球经济中的重要性进一步提升,预示着一个以智能体为核心的新时代的来临。
2024年11月14日,据多家媒体报道,OpenAI计划于2025年1月推出一款名为“Operator”的全新AI助理产品。这款产品旨在自动执行多种复杂任务,包括编写代码、预订旅行和自动电商购物等。据悉,Operator将作为研究预览版和开发工具首先面向开发者推出,开放API接口以供开发人员使用。这一产品的发布标志着OpenAI在智能体领域的又一重要进展,旨在通过解放用户的双手,提供更高效便捷的服务。公司内部员工透露,OpenAI一直致力于推动这一项目的进展,以期在未来进一步扩展其应用领域。
发布时间:2025年1月4日
Google于2025年1月4日正式推出由Gemini驱动的AI Agent,这一技术能够通过控制Chrome浏览器自主进行网页浏览和人类互动。2024年12月12日的演示显示,用户可以通过Prompt指令让AI Agent完成多项任务,如查找公司邮箱。Google的新一代大模型Gemini 2.0在速度和能力上更进一步,支持原生图像生成和音频输出的多模态功能。该模型还可以调用Google搜索和地图等工具,体现出更强的规划能力。为了使用Gemini Web应用,用户需通过Google账号登录,应用可在写作、规划和学习等方面提供帮助。此外,Gemini 2.0的发布标志着Google在AI领域的新突破,尤其是在Agent技术成为科技公司新战场的背景下。Gemini 2.0实验版已上线,用户可优先体验其全新功能,包括Deep Research和容纳100万个token的上下文窗口。
2025年1月6日,OpenAI发布了最新的AI Agent,能够自动处理各种大小事务,并提供推送提醒。这一功能名为「Tasks」,是OpenAI朝向通用人工智能(AGI)迈出的重要一步。用户只需告诉ChatGPT需要什么以及何时需要,AI Agent便会自动完成任务。此功能支持一次性提醒或重复执行的动作,让AI真正具备了执行力。据悉,OpenAI计划在未来进一步扩展该技术的应用范围。
2025年1月3日——智源研究院近日发布了2025年十大人工智能技术及应用趋势报告,指出AI代理将在科技界成为重要成就之一。报告分析了从基础设施到产品应用的多个领域,特别是Scaling Law、基础模型、具身智能和超级应用等技术的发展方向。AI代理预计将具备更高的自主性,能够执行更多任务,提升人们的生活质量。此外,华尔街投行Wedbush也在其报告中预测英伟达和微软将成为2025年AI领域的科技赢家。Gartner则预测,代理AI技术的兴起将是2025年IT领域的重要趋势之一,这些技术和趋势将重塑行业格局。