2024年12月19日,北京——智源研究院发布并解读了国内外100余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型的综合及专项评测结果。此次评测覆盖了语言及多模态大模型的多方面能力,旨在提供科学、权威、公正和开放的评测体系。评测结果展示了当前大模型技术的最新进展,并为业界提供了一个重要的参考标准。自2024年5月17日智源评测体系推出以来,已广泛应用于大模型能力的全面分析。
2024年12月12日——谷歌在今天凌晨正式宣布推出下一代人工智能模型Gemini 2.0,这一最新模型专为AI智能体时代打造。Gemini 2.0支持多模态输入和输出,具备高级推理和长上下文能力,其速度相较于1.5 Pro版本提升了一倍。该模型能够处理文本、图像、音频和视频等数据类型,表现几乎全面超越之前的版本。
此外,谷歌在Gemini Advanced模式中引入了名为“深度研究(Deep Research)”的新功能。这项工具允许智能体自主浏览网页,对复杂主题进行深入研究,并生成包含相关来源链接的简洁报告。此举被视为谷歌对OpenAI近期一系列产品发布活动的直接回应。通过这些创新,谷歌希望在智能体时代的竞争中保持领先地位。
发布时间:2024年12月18日
360集团近日在北京举办的大模型安全联盟成立仪式上,正式推出了一系列大模型安全产品,旨在应对日益严峻的安全挑战。其中包括大模型系统安全检测平台“360智鉴”和大模型内容安全护栏“360智盾”。这些产品旨在覆盖从模型训练到推理的全链路安全检测,提供对模型服务的组件识别、生态链漏洞扫描以及多语言代码的安全防护。此外,360集团还推出了大模型可信增强工具,进一步增强其安全能力。此次发布标志着360在大模型安全领域的进一步投入,致力于通过有效的安全防护实践和体系化的安全框架,支持产业的数字化转型。
2024年12月18日——字节跳动在“火山引擎FORCE原动力大会”上宣布,豆包大模型的日均处理Tokens从5月的1200亿增长到12月的4万亿,增长超过33倍。这一成就仅用了7个月时间,反映出2024年中国大模型应用市场的爆发式增长。此次大会上,豆包视觉理解模型的定价也进入“厘时代”,每千Tokens仅需0.003元,较行业平均水平低85%。这一大幅降价使得企业能够以更低成本获取高效的视觉理解能力。此外,豆包大模型家族还进行了全面升级,推出视频理解模型、3D生成模型等新功能,预示着未来在多模态场景中的更广泛应用。豆包大模型的迅猛发展表明,国产大模型的春天正在到来。
2024年12月17日——脑极体发布文章指出,2024年大模型经历了漏斗秩序的严峻检验,行业竞争进一步加剧。自OpenAI于2022年发布ChatGPT以来,大模型迅速成为科技行业的焦点,并在2023年迎来爆发。然而,随着2024年的到来,市场竞争愈加激烈,企业面临巨大的生存和发展压力。许多公司因无法承担高昂的成本而退出市场,仅有少数能够在竞争中立足。尽管如此,AI技术仍在不断进化,生成式AI在2024年实现了从“能用”到“好用”的飞跃,深刻改变了人类的工作和生活方式。
发布时间:2024年12月20日
阿里巴巴在语音语言模型领域取得了显著进步,尤其是在文本大模型的推动下,其语音语言模型的能力得到了巨大提升,覆盖面更为广泛。然而,尽管在一般中文场景的开放式问答和生成任务中表现稳定,阿里巴巴的语言模型在复杂场景的具体任务中与专家模型相比仍存在差距,与国际一流水平尚有显著差距。此外,国内其他头部语言模型也面临类似挑战,整体而言,性能良好且通用能力强的开源语音语言模型在具体任务上仍需进一步优化。
2024年12月20日——火山引擎宣布对旗下火山方舟、扣子和HiAgent三款平台产品进行重要更新,以全面支持企业大模型的加速落地。这些更新旨在帮助企业构建强大的AI能力中心,并高效开发AI应用。此次更新是字节跳动旗下豆包大模型家族升级的一部分,包括通用模型、语音模型和视觉模型的全面提升。同时,火山引擎推出全域AI搜索功能,通过场景化搜索,提高企业及开发者的效率,推动AI技术的广泛应用。
2024年12月20日,特大号在文章中指出,不涉足大模型技术等于“等死”,但涉足其中仿佛是“找死”,这体现了行业内的激烈竞争和巨大的压力。这一观点反映出在人工智能大模型领域,企业面临的挑战愈发严峻。自2022年11月ChatGPT引领大模型热潮以来,全球大模型数量在短时间内激增,然而,其快速发展也带来了严峻的安全与伦理挑战。2024年初,腾讯公司发布了《大模型安全与伦理研究报告2024》,详细分析了这些挑战。在全球范围内,大模型技术的竞争愈演愈烈,各大企业纷纷推出自己的大模型产品,然而,资金压力和技术门槛使得许多初创公司难以为继。投资者对小型AI公司的前景持悲观态度,认为它们难以与大型企业抗衡,导致投资意愿下降。
发布时间:2024年12月20日
闪极科技宣布,其最新推出的AI眼镜产品——闪极A1,将接入云天励飞、讯飞星火、通义千问、Kimi、智谱等国内十余家主流大模型厂商。该眼镜搭载闪极自研的AI记忆系统,旨在通过整合多方优势提升用户体验。闪极A1以“打造一副好眼镜”为设计蓝本,联合索尼半导体、AAC瑞声科技、LOHO、云天励飞等公司,历经近一年精心研发而成。此外,闪极A1(共创版)售价最低仅为999元,并附送价值299元的“AI云盘+AI闪记”1年免费使用权益。官方还推进了90天无理由退货和打卡返全款政策,吸引了市场的高度关注。
2024年12月20日,腾讯研究院联合发布了《2024大模型十大趋势》报告,指出2024年将成为大模型场景落地之年。其中,OPT大模型(Outer Product of Tensors)因其高效计算结构和强大的学习能力广受关注。5月18日的细节显示,OPT大模型在技术原理、最新进展及应用场景方面取得显著突破。此外,7月8日,腾讯进一步揭示了大模型的最新趋势,包括算力底座向十万卡集群的突破,以及LLM带来的推理能力飞跃,开启“智力即服务”的新篇章。
2024年12月20日——零一万物近日估值达到20亿美元,并计划在2024年重点拓展C端市场。该公司被列入“AI六小强”之一,与百川智能、智谱AI、月之暗面和Minimax等公司在今年均获得超过亿元人民币的融资。另一家同为“六小强”的公司,阶跃星辰,也在今年6月传出正在进行一轮估值20亿美元的融资。零一万物的C端产品布局主要针对海外市场,旨在寻找产品与市场的最佳匹配度。与此同时,百川智能的估值达18亿美元,在国内大模型赛道中排名前三。
发布时间:2024年12月20日
随着2024年接近尾声,SuperCLUE发布了一份关于大模型发展的全景图,指出国内外大模型能力的持续进步。2024年4月30日,《中文大模型基准测评2024年度4月报告》正式发布,提供了对全球大模型发展现状的深刻观察和分析。报告中,SuperCLUE-Math6作为GSM8K的中文升级版,专注于提升中文大模型在数学推理方面的核心能力。
在大模型的发布节奏上,Baichuan系列模型在2024年也取得了突破。百川在2024年8月16日发布了Baichuan 4模型,将发布频率从每月调整为每季度。此前在2024年1月,百川推出了Baichuan 3模型。
中国开源社区的活跃度也在持续提升,开发者和贡献者的数量显著增加。以华为和阿里巴巴为代表的企业在国际开源项目中的参与度逐步加深。展望未来,AI Agent和具身智能被认为是新一代大模型的重要应用场景,而GPT-5则有望推动全球算力和应用的进一步发展。
此外,OpenAI在2024年也发布了视频生成大模型Sora及其升级版Sora Turbo,支持1080p分辨率并可生成最长20秒的视频。Sora Turbo特别提升了生成速度,支持多种视频比例。美图公司在2024年5月6日宣布其美图奇想大模型(MiracleVision)的视频生成能力在SuperCLUE的评测中位居国内第一。
发布时间:2024年12月20日
火山引擎于昨日正式发布创新产品Prompt优解,旨在通过“自动+互动”方式帮助用户快速编写提示词。该产品允许用户在互动过程中表达需求,迅速上手,推动大模型的实际应用。Prompt优解利用机器实现类似人类的反思、类比和错误总结能力,有效提升用户体验。作为一站式大模型服务平台,火山引擎希望通过这一解决方案加速大规模模型的落地应用。