NoxRobot

1: DeepSeek-R1模型震撼上线

发布时间：2024年1月20日

1月20日，人工智能领域迎来一件重大事件——DeepSeek团队正式上线全新的开源推理大模型DeepSeek-R1。这款模型凭借其在数学、编程和推理等领域的卓越表现，引发广泛关注。DeepSeek-R1在后训练阶段大规模应用了强化学习技术，即使在仅有极少标注数据的情况下，也显著增强了推理能力。同时，该模型在国际数学和编码领域的表现尤为突出，几乎可媲美博士生。

值得一提的是，DeepSeek-R1采用了MIT许可，允许免费用于商业应用，使其成为AI开发者和研究人员的强大工具。这一模型在GitHub上线后，一夜之间收获了超过4000个星标，迅速引爆大模型领域。此外，R1系列通过创新的强化学习训练方式，大幅提升了推理能力，并以高性价比的API服务挑战OpenAI的多阶段强化学习训练策略。

DeepSeek-R1的推出不仅标志着AI推理能力的重大进步，也为未来AI技术的发展提供了新的可能。

2: 豆包大模型1.5 Pro正式发布

发布时间：2024年1月22日

1月22日，字节跳动旗下的豆包大模型1.5 Pro版本正式发布。豆包表示，该版本在综合能力上有显著增强，具备低训练和推理成本的高效模型结构，并全面提升了多模态能力和推理能力。新模型使用较小的激活参数进行预训练，采用大规模稀疏MoE架构，实现了等效于7倍激活参数的Dense模型性能，远超业内MoE架构约3倍。此外，豆包的视觉理解模型Doubao-1.5-vision-pro和实时语音模型Doubao-1.5-realtime-voice-pro亦得到升级，视觉理解能力达到全球领先水平。该模型已在豆包APP灰度上线，开始接受海量请求的实际测试。

2024年1月 大模型头条：第13期

1: DeepSeek-R1模型震撼上线

2: 豆包大模型1.5 Pro正式发布

2024年1月大模型头条：第13期