2024年1月 大模型头条:第14期

类别: 大模型 日期: 2025-01-24 06:38:24

1: MiniMax发布四大AI模型,推动行业创新

发布时间:2025年1月24日

自2025年1月以来,AI独角兽企业MiniMax在短短十天内连续发布了四个AI模型,标志着其在人工智能领域的重大进展。1月15日,MiniMax在上海宣布开源其全新01系列模型,包括基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。这些模型在架构上进行了大胆创新,首次大规模应用线性注意力机制,突破了传统Transformer架构的限制,能够处理长达400万token的输入,性能媲美国际顶尖模型。

此外,MiniMax还推出了视频生成模型S2V-01和语音模型,进一步拓展了在文本、视觉和多模态领域的能力。这些模型的发布迅速引起业界广泛关注,特别是视频模型因其在超逼真视频生成和手部动作精准模拟方面的卓越表现,备受瞩目。

MiniMax于2021年12月成立,致力于成为通用人工智能时代的基础设施建设者,其开放平台融合文本、语音、视觉三模态,提供安全、灵活、可靠的AI解决方案。公司计划通过这些创新模型,进一步推动AI技术的应用和普及。

2: 深度求索发布新一代模型DeepSeek-R1

2025年1月20日,国内知名AI公司深度求索(DeepSeek)正式发布了新一代推理大模型DeepSeek-R1,并同步开源了模型权重。该模型在数学、代码和自然语言推理等任务上表现卓越,其性能与OpenAI的o1正式版相当。DeepSeek-R1在后训练阶段广泛应用了强化学习技术,即使在极少标注数据的情况下,也显著提升了模型的推理能力。DeepSeek-R1遵循MIT开源协议,允许用户通过模型蒸馏技术训练其他模型。此外,DeepSeek还提供了高效的API服务,进一步拓展了其在编程辅助领域的应用前景。用户可以通过访问官方网页,体验模型的强大推理能力和可视化的思维过程。

3: 融合大模型推动多模态信息分析

发布时间:2025年1月17日

近日,「日日新」融合大模型正式亮相,其能够将文字、图像、声音等多种信息进行综合分析,为用户提供实际参考价值的深度洞察。该技术的推出被认为是人工智能领域的一大突破,尤其是在多模态学习和跨模态迁移技术的支持下,进一步推动了脑机接口和人形机器人技术的成熟。与此同时,智能体的能力也在多模态、推理微化、端侧应用等新技术的推动下不断增强,为未来的人工智能应用带来了更多可能性。