2024年12月 大模型头条:第7期

类别: 大模型 日期: 2024-12-23 08:14:17

1: 阶跃星辰完成数亿美元B轮融资

2024年12月23日,国内人工智能大模型公司阶跃星辰宣布完成B轮融资,总融资金额达数亿美元。此次融资吸引了多家国有资本、战略投资者和财务投资者参与。核心投资方包括上海国有资本投资有限公司及其旗下基金,战略和财务投资人则包括腾讯投资、五源资本、启明创投等知名机构。公司表示,这笔融资将用于进一步推动大模型技术的研发和应用落地。阶跃星辰由微软前全球副总裁姜大昕创办,近年来在自研大模型和应用产品方面取得了显著进展。

2: 百川智能发布Baichuan4-Finance大模型

2024年12月23日——百川智能今日宣布推出全链路领域增强金融大模型Baichuan4-Finance。该模型基于高质量的金融数据,采用行业首创的领域自约束训练方案,实现了金融能力和通用能力的同步提升,显著提高了金融场景的整体可用性。据悉,该模型在FLAME-Cer评测中,超越了当前的通用能力标杆模型GPT-4o及国内首个开源中文金融大模型XuanYuan3-70B-Chat。此次发布由中国人民大学财政金融学院的金融专家团队全程参与定义和评估,确保了模型的专业性和实用性。百川智能的这一举措再次展示了其在人工智能领域的创新实力。

3: NVIDIA发布Jetson Orin Nano Super,性能大幅提升

发布时间:2024年12月23日

英伟达(NVIDIA)于2024年12月23日发布了全新的Jetson Orin Nano Super开发者套件。这款产品在生成式AI推理性能上相比上一代提升了1.7倍,达到了67 INT8 TOPS,同时内存带宽提高了50%,达到102GB/s。该开发板售价仅为249美元,相较于前代产品499美元的价格几乎减半。Jetson Orin Nano Super适用于商业AI开发者、科技爱好者和学生,能够满足大语言模型、视觉AI代理和AI机器人等多种应用需求。通过软件升级,该套件还为现有的Jetson Orin Nano用户提供了性能提升的途径。英伟达的这一发布为AI开发领域带来了更高性价比的选择。

4: 李飞飞团队发布VSI-Bench评估工具

2024年12月23日,斯坦福大学著名教授李飞飞及其团队推出了一项名为VSI-Bench的新工具,用于评估多模态大模型的视觉空间智能能力。李飞飞,被誉为“AI教母”,一直在多模态人工智能领域进行前瞻性研究。这项研究揭示了多模态大模型在空间智能和记忆方面的潜力。团队成员张天杰和谷雨共同参与了这一研究,耗时半年打造了VisualAgentBench(VAB),涵盖3个应用场景和5个环境。VSI-Bench的发布标志着多模态AI模型在视觉和空间智能领域的进一步突破。

5: 谷歌发布最新AI模型Gemini 2.0

2024年12月23日——谷歌近日宣布推出其最新的人工智能大模型Gemini 2.0,这一版本以低延迟和增强性能为特色,支持多模态输入。Gemini 2.0的多模态能力实现了重大突破,能够处理文本、图像、音频和视频等多种数据类型。相比其前身1.5 Pro,Gemini 2.0不仅在速度上达到两倍提升,还具备更强的推理和规划能力。

谷歌还推出了三个基于Gemini 2.0架构的AI智能体原型,分别是Project Astra、Project Mariner和Jules,每个原型都针对特定应用场景进行优化。开发者现在可以通过Google AI Studio和Vertex AI中的Gemini API获取体验版模型,使用多模态输入和文本输出功能。Gemini 2.0被认为是谷歌迄今为止最强大的AI模型,标志着从单模态系统向更复杂的多模态模型的转变。

6: 腾讯研究院发布《2024工业大模型应用报告》

2024年12月23日——近日,腾讯研究院发布了《2024工业大模型应用报告》。该报告深入分析了大模型技术在工业智能化发展中的应用现状、机遇和挑战,并对未来进行了展望。报告指出,工业领域正从数字化向智能化转型,而大模型凭借其卓越的理解和预测能力,成为这一转型的重要引擎。报告还强调,由于工业场景要求严苛,核心业务场景对模型的准确率要求达到95%以上,容忍幻觉发生率为零,因此通用基础大模型的工业知识积累往往难以满足这些严格的应用需求。该报告对于在校科研人员和即将进入职场的专业人士都具有重要的指导意义。

7: 阿里云全新升级AI大基建,发布Qwen2.5

2024年9月20日——在2024云栖大会上,阿里巴巴宣布全面升级其AI基础设施,同时发布了全新的开源模型“通义千问”Qwen2.5。Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,性能超越Llama 405B,继续稳居最强开源大模型之列。阿里云CTO周靖人表示,阿里云正在树立AI时代基础设施的新标准,通过全方位建设更有效率的AI大模型计算设施,进一步巩固其核心竞争力。与此同时,阿里巴巴还在开源社区中贡献了超过100个模型,累计下载量已超过4000万次。通过这些举措,阿里巴巴希望吸引更多客户使用其大模型基础设施,加速AI技术的普及和应用。

8: SuperCLUE发布2024上半年中文大模型报告

2024年7月9日,SuperCLUE发布了《中文大模型基准测评2024上半年报告》。报告选取了国内外有代表性的33个大模型,并通过多维度综合性测评,深入观察并分析了大模型在中文领域的发展现状。数据显示,国内外第一梯队大模型在中文领域的通用能力差距持续缩小,从2023年5月的30.12%缩小至2024年6月的4.94%。这一变化反映了国内外在大模型技术上的高速发展与竞争。SuperCLUE的持续跟踪与测评为业内提供了重要的参考依据,帮助各方了解大模型的最新发展趋势以及在中文领域的表现。

9: 大模型发展趋势:迈入“机器外脑”时代

2024年12月23日——近日,腾讯论坛发布了《2024大模型十大趋势——走进“机器外脑”时代》报告,详细预测了未来大模型的发展方向。报告指出,全球正迈入一个“机器外脑”时代,这一转变得益于海量GPU与新一代大模型的结合。十大趋势涵盖了从算力底座到推理分析、创意生成、情绪智能、具身智能、开源共享及人机对齐等多个方面。这些趋势不仅体现了技术的飞速进步,也标志着大模型在各个领域的深度应用。报告强调,这一发展将对人类社会产生深远影响,推动各行业的创新和变革。

10: 腾讯研究院发布2024年中国行业大模型市场报告

2024年12月23日,腾讯研究院发布《2024年中国行业大模型市场报告》,对大模型在各行业的应用进行了深入分析。报告指出,大模型以其广泛适用性和全面的知识体系,显著缩短了人工智能模型的开发周期,并大幅降低了开发成本,为各行业的深度应用提供了有力支持。近年来,大模型已成为人工智能领域的热点,推动生产力革新和产业升级。大模型的商业化应用已进入金融、医疗、教育等关键行业,解决了专业领域的复杂问题。报告还强调,2024年政府工作报告明确提出了大模型技术的重要性,促进了行业大模型的发展。报告中提到的主要上市公司包括科大讯飞、商汤科技和三六零等。