2024年1月 大模型头条:第3期

类别: 大模型 日期: 2025-01-06 02:22:50

1: 马斯克宣布Grok 3即将推出

发布时间:2025年1月3日

当地时间1月3日,特斯拉和SpaceX的创始人埃隆·马斯克宣布,xAI公司的下一代人工智能模型Grok 3即将面世。马斯克在个人社交平台X上透露,Grok 3的预训练现已完成,其计算量较前代Grok 2提升了10倍。此前,Grok 3的发布因延期而引发热议,原计划应在2024年底推出。据悉,Grok 3使用了10万块英伟达H100芯片进行训练。此举再次引发了科技界对xAI公司未来发展的高度关注。

2: 法国初创公司Mistral推出多模态AI模型Pixtral 12B

发布时间:2024年9月12日

法国人工智能初创公司Mistral近日发布了其首款多模态人工智能大模型——Pixtral 12B。这款模型以120亿参数和约24GB的模型体积,具备同时处理图像和文本的能力,标志着Mistral在AI技术领域的重大突破。Pixtral 12B是基于Mistral之前发布的文本模型Nemo 12B构建的,并通过增加一个4亿参数的视觉适配器实现图像处理功能。该模型不仅可以生成图像描述,还能理解复杂公式和图表,展现出在处理复杂任务方面的巨大潜力。这个多模态AI模型受到了全球科技界的广泛关注,进一步巩固了Mistral在AI领域的创新地位。

3: “坤安”大模型发布,重塑有色金属行业

2025年1月1日——由中国有色金属工业协会与中国铝业集团(中铝集团)共同开发的有色金属行业首个人工智能大模型“坤安”在北京发布。“坤安”大模型采用了华为全栈自研的盘古大模型技术,包含了百亿级有色金属行业的数据和专业知识,具备自然语言处理、图像处理、预测、科学求解等多项能力。该模型的应用将覆盖采矿、选矿、氧化铝、电解铝以及铝/铜加工等核心生产场景。研发团队表示,“坤安”将通过人工智能技术重塑有色金属地质勘探、矿产资源管理等领域,提高行业效率和智能化水平。发布会上,中国工程院院士、中南大学校长李建成强调,人工智能将成为推动有色金属行业高质量发展的关键驱动力。

4: 百度创始人李彦宏展望2025年AI应用增长

2025年1月2日——百度创始人兼首席执行官李彦宏在公司成立25周年之际发表全员信,预测2025年人工智能(AI)应用将迎来井喷式增长。李彦宏强调,技术创新是百度的核心竞争力,他期望公司在2023和2024年所奠定的基础能够在2025年开花结果。尽管超级应用尚未出现,但AI的实际渗透率已不低,未来将继续加速发展。此外,李彦宏指出,AI领域的竞争愈加激烈,百度正努力在这一领域树立新的标杆,期望通过持续的技术进步实现产业升级。

5: Meta推出Llama 3.1:开创性开源大模型

发布时间:2025年1月2日

Meta公司宣布推出其最新的开源大模型Llama 3.1,这一模型是迄今为止最强大的开源语言模型,拥有4050亿参数。Llama 3.1能够支持上下文长度达到128K Tokens,基于超过15万亿个Tokens的数据集进行训练。这一训练在超过1.6万个H100 GPU上完成,是Meta有史以来最大规模的训练项目。Llama 3.1的推出标志着Meta在大语言模型领域的重大进展,支持多语言和代码生成,并在性能上与GPT-4o和Claude 3.5相媲美。Meta还提供了免费开源的权重和代码,使得该模型可以在全球范围内自由部署。此次发布也反映了Meta对开源AI技术的承诺,期待推动行业的进一步创新与发展。

6: 大模型领域迎来融资热潮

2025年1月1日——临近2024年年末,大模型领域再度掀起融资热潮。据《科创板日报》报道,12月23日,人工智能领域的大模型独角兽公司阶跃星辰宣布完成数亿美元的B轮融资。本轮融资由上海国有资本投资有限公司及其旗下基金领投,其他参与者包括腾讯投资、五源资本、启明创投等多家知名投资机构。这次融资是在大模型行业投融资环境趋紧的背景下实现的,显示出资本市场对该领域未来发展的信心。

除了阶跃星辰外,智谱公司也于12月17日宣布获得了30亿元人民币的新融资。两家公司的成功融资引起了业内的广泛关注,成为当前大模型领域的亮点。尽管融资环境挑战重重,但业界人士预计,未来大模型及相关企业的融资将面临更大的难度,企业可能需要更多寻求国际资本的支持。

7: 智谱完成30亿元融资,估值超200亿元

2024年12月17日,《科创板日报》报道,国内大模型企业智谱宣布完成新一轮30亿元人民币融资。新投资方包括多家战略投资者及国资背景机构,老股东君联资本继续跟投。本轮融资将用于智谱GLM大模型系列的进一步研发,目标是提升其在复杂推理和多模态任务上的能力。此笔融资使得智谱成为估值率先超过200亿元的大模型创业企业之一。智谱此前已完成至少12轮融资,投资方阵容豪华,包括北京市人工智能产业投资基金、社保基金中关村自主创新基金、美团、阿里巴巴和腾讯等知名机构。

8: 2024年AI大模型发展总结

发布时间:2025年1月1日

2024年,人工智能领域迎来了激动人心的发展,各类大模型在技术和应用上取得了显著突破。OpenAI在大型语言模型(LLM)方面发布了更强的o系列模型,进一步提升了文本生成和信息抽取的能力。视觉生成领域,SD的替代者Flux成为新宠,为图像生成带来了更多创新。视频生成技术也不甘示弱,开始支持超短视频的精细操控和风格化处理。

这一年,各大厂商积极推进大模型在金融、医疗、教育等行业的应用,推动行业定制化模型的快速落地,解决了许多专业领域的复杂问题。多模态模型的能力逐渐增强,成为研究热点,旨在模拟人类大脑的综合信息处理。

值得注意的是,市场竞争加剧,各家厂商在技术和市场策略上展开激烈较量。未来,随着技术进一步成熟,AI大模型有望在更多领域实现突破和创新。

9: 谷歌发布最强大语言模型Gemini 1.0

2023年12月7日,美国时间12月6日,谷歌在硅谷正式发布其最新的大语言模型Gemini 1.0。谷歌首席执行官桑达尔·皮查伊表示,Gemini 1.0是谷歌迄今为止功能最强大的通用人工智能模型。该模型以原生多模态打造,标志着谷歌进入Gemini模型时代的重要一步。皮查伊指出,2025年将是公司关键的一年,面临激烈的竞争和监管压力,Gemini的推出被视为应对这一挑战的重要举措。谷歌计划在未来进一步优化和扩展该模型的能力,以满足不断变化的市场需求。

10: OpenAI新推理模型o3发布

2024年12月22日——OpenAI在一年一度的“12 Days of OpenAI”活动中发布了其最新推理模型o3及其精简版o3-mini。o3模型的问世标志着推理能力的显著飞跃,尤其在数学、编程和博士级科学问答等复杂问题上,性能超越部分人类专家。OpenAI表示,o3在某些场景下的推理能力非常接近通用人工智能(AGI)。这一发布紧随2024年9月推出的o1模型及其在多个领域的优异表现之后。o3的推出进一步巩固了OpenAI在人工智能领域的领导地位,并成为其2024年技术创新的重要里程碑。

11: 国产大模型面临挑战

2025年1月1日 - 国产大模型在2025年可能面临掉队风险,原因包括缺乏持续创新能力、组织能力不足以及业务场景单一等。在激烈的市场竞争中,百度创始人李彦宏在公司成立25周年之际表示,技术创新是百度的核心竞争力,这使得百度在大模型领域的竞争中更具优势。同时,腾讯等公司也在加速推进新一代大模型的发布,进一步加剧市场竞争。此外,字节跳动和阿里巴巴正在争夺AI大模型的云端市场,行业内的快速技术升级和场景拓展成为企业发展的关键。面对这种局面,一些缺乏竞争力的企业可能会在2025年失去市场地位。

12: 大模型六小虎:中国AI创业独角兽崛起

2025年1月1日——据财新周刊报道,2024年被视为生成式人工智能飞速发展的一年。在这一年里,中国涌现出六家估值超过10亿美元的AI创业公司,被市场称为“大模型六小虎”。这些公司在“百模大战”中经过战算力、战模型、战融资的激烈竞争,最终脱颖而出,成为行业的领军者。与此同时,在绿色金融领域,金融机构利用人工智能和大数据技术,提升了对自然风险的识别和管理能力。此外,小米公布其SU7全年交付量较预期几乎翻倍,而小鹏则计划在2025年扩招,并每月进行新员工招聘。

13: OpenAI发布ChatGPT引爆大模型热潮

发布时间:2025年1月1日

零壹智库作者陈雅丽报道,OpenAI于2022年11月发布了基于GPT-3.5的ChatGPT,迅速在全球范围内掀起了一股大模型热潮。短短半年时间内,多家头部互联网公司和人工智能企业纷纷宣布推出各自的大模型,推动中国进入“百模大战”时代。大模型的建设依赖于综合算力资源、算法人才和数据积累等要素。此外,据零壹智库统计,截至2024年4月,中国大模型相关专利已超过5.2万件,2024年起每月平均增长率达9%到10%。这一增长得益于国家政策的支持和技术的快速进步。