2024年12月21日,OpenAI在为期12天的新品发布活动最后一天,正式发布了下一代推理模型o3系列,包括o3和精简版o3-mini。OpenAI首席执行官山姆·奥特曼宣布了这一消息。o3模型是今年早些时候推出的o1模型的升级版本。为了避免与英国电信服务商O2产生商标冲突,OpenAI跳过了“o2”的命名,直接采用“o3”。o3-mini是为特定任务进行微调的版本。公司称,在某些场景下,o3的推理能力非常接近通用人工智能(AGI)。此举标志着OpenAI在AI推理能力及应用方面的重大进步。
2024年12月19日,智源研究院发布了2024年下半年大模型的综合评测结果。此次评测涵盖了超过100个开源和闭源模型,涉及文本、语音、图像和视频等多个领域。尽管语言模型的能力趋于饱和,但在复杂任务上的表现仍逊于国际顶尖水平。同时,视觉语言模型正在逐步缩小与闭源模型之间的差距。评测显示,多模态模型的发展迅速,许多新厂商和新模型涌现,而语言模型的发展速度相对放缓。此次评测为业界提供了一个科学、权威、公正、开放的评测体系,帮助研究者和开发者更好地理解和选择大模型。
2024年12月18日,火山引擎在上海举办的FORCE原动力大会上宣布,豆包大模型家族迎来全面升级。此次升级包括全新的豆包视觉理解模型,该模型具备强大的视觉内容识别和逻辑推理能力,能够处理复杂图像信息。豆包大模型的日均tokens使用量已超过4万亿,自5月发布以来增长超过33倍。豆包视觉理解模型以极具竞争力的价格推出,每千tokens输入仅需3厘,显著低于行业平均水平。此外,火山引擎还计划在2025年1月开放豆包视频生成模型服务,进一步扩展其多模态AI能力。会议上,火山引擎总裁谭待强调了价格透明的商业策略,显示出火山引擎在技术能力和市场策略上的自信。
2024年12月20日——OpenAI宣布推出其最新的推理模型o3和o3-mini,这是继今年早些时候发布的o1模型之后的又一重大更新。o3模型在多个领域的表现均显著优于前代产品,特别是在编码测试SWE-BenchVerified中性能提升了22.8%。此外,在Codeforces竞技编程比赛中,o3也取得了优异的成绩,得分达到了2727分。值得注意的是,o3在ARC-AGI基准测试中获得了87.5%的高分,显示出接近通用人工智能(AGI)的能力。o3-mini作为精简版,具备自适应思考时间功能,适用于特定任务,更高的计算设置能够产生更好的结果。OpenAI表示,o3有望在科学、编码、数学等领域超越人类专家水平,并计划在明年1月向公众开放预览。此次发布活动是OpenAI为期12天的“12 Days of OpenAI”系列活动的收官之作,引发了广泛关注与讨论。
2024年12月23日,百川智能正式发布全链路领域增强金融大模型Baichuan4-Finance。该模型通过行业首创的“领域自约束训练方案”,在高质量金融数据支持下,显著提升了金融数据处理能力和通用能力,有效提高了金融场景的整体可用性。Baichuan4-Finance融合了超过100B的中英文金融知识,并由中国人民大学财政金融学院的金融专家团队全程参与定义和评估。此创新举措使得百川智能在大模型领域再进一步,巩固了其在金融科技应用中的领先地位。
2024年12月18日——腾讯元宝现已集成最新的混元文生视频大模型,用户只需输入描述即可生成视频。据悉,该功能支持中英文双语输入、多种视频尺寸及清晰度。12月3日,腾讯宣布其混元大模型正式上线视频生成能力,并开源该模型,参数量达130亿,是当前最大的视频开源模型。用户可在腾讯元宝App中尝试这一新功能,企业客户则可通过腾讯云接入服务。该模型允许用户输入1000字以内的文字提示,选择不同风格如动画、电影、赛博朋克等,迅速生成高质量AI视频。混元文生视频支持复杂的动作描述,使生成的视频更加连贯和真实。
发布时间:2024年12月17日
2024年被视为AI硬科技的创新大年,各大厂商纷纷将目光投向具体应用场景,推动行业定制化的大模型加速落地。以ChatGPT为代表的多模态AI大模型成为人工智能迈向通用智能的里程碑技术。自2018年以来,OpenAI公司先后发布了GPT-3.5、GPT-4、Sora等大模型,参数规模突破万亿,模型训练数据量不断增加。
在应用方面,AI技术正向通用型、工具型、行业型和硬件型等多领域扩展。为满足AI大模型训练和应用过程中对计算、网络和存储的需求,业界正在构建大规模、高速响应、高精度及卓越性能的算力基础设施。与此同时,中国在AI大模型领域也取得显著进展,讯飞星火等国内大模型在多模态能力和逻辑推理等方面表现出色。
“不卷参数卷应用”成为AI行业共识,硬件设备加速智能化,AI正在深刻改造软件和硬件领域。埃森哲的《技术展望2024》报告指出,AI伙伴、智能体、空间计算和人机互通将成为数实融合发展的关键要素。国内主流AI应用的快速发展,预示着人工智能将进一步加速融入社会各个方面,推动行业变革和创新。