2024年1月 大模型头条:第4期

类别: 大模型 日期: 2025-01-07 09:06:18

1: 传音控股与阿里云合作,AI手机搭载新大模型

2025年1月7日——据阿里云官方微博消息,传音控股与阿里云达成合作,阿里云的通义千问大模型现已搭载在传音旗下科技品牌TECNO推出的AI手机PHANTOM V Fold2中。这款手机通过机身上的特定AI按键,可实现一键调用端侧大模型功能,打造深度本地化的“实用型AI”。据了解,中国有一半的大模型企业在阿里云上运行,阿里云计划继续与各行业携手推动AI创新。

2: 英伟达发布新一代AI模型,引领代理式人工智能新时代

2025年1月7日——在拉斯维加斯举行的CES 2025大会上,英伟达创始人兼CEO黄仁勋推出了全新的Llama Nemotron系列大语言模型,标志着人工智能进入代理式人工智能(agentic AI)新时代。黄仁勋指出,这些专业的AI代理将帮助人们解决复杂问题并自动执行重复性任务。他介绍了三个版本的Llama Nemotron模型:Nano、Super和Ultra,旨在推动代理AI的发展。此外,黄仁勋还宣布英伟达汽车业务将在2026财年实现50亿美元的收入规模,并发布了RTX50系列新显卡,其中包括售价高达1999美元的RTX 5090,作为迄今为止运行速度最快的消费级GeForce RTX GPU,内置920亿晶体管。黄仁勋的演讲强调了AI在全球约10亿知识工作者中的潜力,预测AI代理有望成为一个重要工具。

3: AWS发布Stable Diffusion 3.5 Large模型

2025年1月6日——AWS宣布Stable Diffusion 3.5 Large模型现已在Amazon Bedrock平台上线,这款由Stability AI开发的最新图像生成模型使用了Amazon SageMaker HyperPod进行训练,提供了对超大规模AI模型训练的理想算力支持。此外,AWS计划在2025年推出Trainium3芯片,以进一步增强其在芯片层面的能力。据悉,Trainium3将采用最新的技术突破。与此同时,AWS还在Amazon Bedrock中引入了Stability AI的最新模型,并通过全新的Amazon Bedrock Marketplace功能,为客户提供超过100个热门、新兴及专业模型的访问权限。这一系列举措显示出AWS在AI模型领域的持续投入和创新。

4: 百度创始人李彦宏展望AI未来

2025年1月5日——百度创始人李彦宏近日表示,预计到2025年,人工智能应用将迎来井喷式增长,百度正致力于成为人工智能领域的新标杆。他强调,技术创新始终是百度的核心竞争力,公司并不追求短期内创造大量营收,而是注重长期技术积累和创新。

李彦宏指出,人工智能生成内容(AIGC)将迎来三个发展阶段,包括在文字、图像、视频、音频、游戏以及虚拟人等领域的广泛应用。他认为,这种技术方向性的改变,将对未来的数字经济产生深远影响。同时,李彦宏重申百度对环境责任的承诺,目标是在未来实现碳中和。

此外,李彦宏强调,面对快速变化的技术环境,企业需要顺应潮流、适者生存,以保持竞争优势。百度将继续在人工智能领域投入,推动技术与产业深度融合,为社会发展贡献力量。

5: 人工智能年度总结报告发布

2025年1月5日,Artificial Analysis平台发布了2024年AI大模型总结报告,全面分析了包括大语言模型(LLM)、视觉生成模型如文本生成图像和视频等在内的多种AI模型。Artificial Analysis是一家领先的独立AI基准测试和分析平台,致力于为人工智能领域的专业人士和新手提供最新的AI技术资讯、工具和产品测评。报告指出,商汤科技的“日日新SenseNova”大模型体系展示了语言大模型及AI文生图创作、2D/3D数字人生成和大场景/小物体生成等一系列生成能力。此外,微软推出了轻量级人工智能模型Phi-3 Mini,这是该公司计划发布的三款小型模型中的第一款,其参数量达38亿个。2024年,AI技术的发展依旧迅猛,科技巨头与AI机构在更高智能的道路上不断探索。

6: Llama 3 70B紧追GPT-4,AI模型竞赛激烈

发布时间:2025年1月4日

在2025年1月4日的LMSys领先排行榜中,Llama 3 70B在英语提示的筛选中表现优异,仅次于GPT-4。多家模型正在快速逼近或超越GPT-4设定的标准,其中开源新秀Llama 3表现尤为突出。

与此同时,Robin第二代模型在仅用18万条数据微调后,在Huggingface榜单上取得了第一名的佳绩。LMFlow工具支持用户快速训练个性化模型,只需一张3090显卡和5小时即可微调70亿参数,显示出强大的定制化能力。

在中文领域,一款开源底座模型经过约1T标识符的中英双语训练,并通过监督微调、人类反馈强化学习等技术,针对中文问答和对话进行了优化,表现出色。

此外,2024年1月29日的评估结果显示,660亿参数的CritiqueLLM在多项任务中与人工评分的相关系数均超过ChatGPT,达到与GPT-4相当的水平。在成本方面,根据AI Index的估算,训练最先进的人工智能模型的费用达到了新的高峰,例如,OpenAI的GPT-4的训练成本约为7800万美元。

这些进展凸显了当前AI模型在各个领域的快速发展和竞争激烈的态势。

7: 英伟达推出Llama Nemotron语言模型

发布时间:2025年1月3日

英伟达创始人兼CEO黄仁勋在2025年CES上宣布推出基于Llama技术的Llama Nemotron语言基础模型。该系列分为Nano、Super和Ultra三个版本,旨在推动代理AI(agentic AI)的发展。这些开放式大语言模型的设计基于Meta的Llama技术,帮助开发人员在应用程序中创建和部署AI解决方案。此外,黄仁勋还推出了新的RTX50系列显卡,进一步强化英伟达在AI芯片市场的领导地位。英伟达通过这些创新,继续在全球AI技术领域保持竞争优势。