2024年12月 大模型头条:第10期

类别: 大模型 日期: 2024-12-25 02:22:10

1: OpenAI推出o3推理模型,接近通用人工智能

发布时间:2024年12月20日

美国开放人工智能研究中心(OpenAI)于2024年12月20日发布了其最新的人工智能推理模型——o3及其轻量版o3-mini。该公司宣称,o3具备更先进的、近似人类的推理能力,能够在代码编写、数学竞赛以及掌握人类博士级别的科学知识等复杂任务中表现出色。此次发布的o3系列模型是o1的迭代版本。由于担心与英国电信运营商O2存在版权或商标冲突,OpenAI跳过了“o2”命名,直接采用“o3”。

在“12 Days of OpenAI”活动的最后一天,OpenAI首席执行官萨姆·奥特曼宣布了这两个模型的推出。o3在ARC-AGI基准测试中得分高达87.5%,远超人类平均水平,标志着OpenAI在通向通用人工智能(AGI)道路上的重要进步。o3-mini则是针对特定任务微调的精简版模型,支持低、中、高三种推理时间模式,用户可以根据任务复杂度灵活调整模型的思考时间。预计o3和o3-mini将在明年初向公众开放。

2: 字节跳动推出豆包视觉理解模型,价格创新低

发布时间:2024年12月20日

在近日举办的“火山引擎Force”大会上,字节跳动正式发布了其最新的豆包视觉理解模型。该模型以极具竞争力的价格优势引发行业关注,每千tokens的输入费用仅为3厘(0.003元)。这一定价被认为是行业内的重大突破,比行业平均价格降低了85%。

豆包视觉理解模型的推出被视为字节跳动在多模态大模型领域的重要进展,提供了更具性价比的视觉理解能力。公司表示,这一创新将有助于降低生态系统内的视觉理解成本,为企业带来实质性经济效益。

通过豆包视觉理解模型,用户只需花费一元钱即可处理约284张720P的图片,大幅降低了企业在视觉数据处理方面的成本。这一举措不仅使视觉理解类大模型的价格步入“厘时代”,也标志着字节跳动在AI技术商业化应用上的又一重要里程碑。

3: 中国AI大模型快速发展引关注

2024年12月9日,北京——国家部委最新发布的《生成式人工智能应用发展报告(2024)》揭示了中国大模型技术的前沿动向。报告指出,生成式人工智能产品的用户规模已达2.3亿人,标志着这项技术在各行业的快速渗透和应用。2024年,中国AI领域的投融资活动持续火爆,年内融资金额已超820亿元,显示出资本市场对AI产业的强烈兴趣与支持。

报告还透露,截至2024年7月,中国已完成备案并上线的生成式人工智能服务大模型达到190多个,普及率达16.4%。北京、上海、广东成为生成式人工智能产品备案的主要地区,显示出这些地区在AI技术应用方面的领先地位。

此外,报告强调,生成式AI及其带来的生产力提升、成本降低,正在推动云计算和开源技术的进一步发展。这一趋势正深刻影响着全球经济和社会的发展。各行各业正在积极拥抱生成式人工智能,推动技术与产业的深度融合。

4: 阿里巴巴宣布全面升级AI大基建

2024年12月9日,在云栖大会上,阿里巴巴宣布将全面投入升级AI大基建,并发布了性能更强的开源模型。这次升级旨在推动大模型能力的提升和应用,进一步巩固阿里在AI领域的领先地位。本届云栖大会于2024年9月19日至21日在杭州举行,以“云启智跃产业蝶变”为主题,吸引了众多业界专家和企业参与。阿里云在大会上发布了通义旗舰模型Qwen-Max,参数规模显著提升,性能媲美GPT-4o。此外,阿里云还推出了最强开源模型Qwen2.5系列,并在大会上宣布技术架构全面升级,使得其数据中心的运作能力如同超级计算机。阿里巴巴集团董事会主席兼CEO张勇强调,AI时代的到来将重新定义所有产品,推动产业的深刻变革。

5: 阿里通义千问Qwen2-72B表现优异

2024年12月9日,斯坦福大学基础模型研究中心发布了最新的大模型测评榜单HELM MMLU结果。阿里巴巴的通义千问Qwen2-72B模型表现突出,在榜单中排名第五,仅次于Claude 3 Opus、GPT-4o、Gemini 1.5 pro和GPT-4,是开源模型中排名最高的,超越了Llama3-70B等其他开源和部分闭源模型。该模型在综合评测中得分为0.824,与GPT-4并列全球第四。通义千问Qwen2-72B模型的优异表现再次证明了其在大模型领域的显著能力。