英伟达发布80亿参数新AI模型:精度、效率高,可在RTX工作站上部署

choupijiang2024-08-23 09:37:36IT之家

8 月 23 日消息,英伟达于 8 月 21 日发布博文,发布了 Mistral-NeMo-Minitron 8B 小语言 AI 模型,具备精度高、计算效率高等优点,可在 GPU 加速的数据中心、云和工作站上运行模型。

英伟达携手 Mistral AI 上月发布开源 Mistral NeMo 12B 模型,在此基础上英伟达再次推出更小的 Mistral-NeMo-Minitron 8B 模型,共 80 亿个参数,可以在搭载英伟达 RTX 显卡的工作站上运行。

英伟达表示通过宽度剪枝(width-pruning)Mistral NeMo 12B,并知识蒸馏(knowledge distillation)轻度重新训练后获得 Mistral-NeMo-Minitron 8B,相关成果发表在《Compact Language Models via Pruning and Knowledge Distillation》论文中。

剪枝通过去除对准确率贡献最小的模型权重来缩小神经网络。在 "蒸馏" 过程中,研究小组在一个小型数据集上重新训练剪枝后的模型,以显著提高通过剪枝过程而降低的准确率。

就其规模而言,Mistral-NeMo-Minitron 8B 在语言模型的九项流行基准测试中遥遥领先。这些基准涵盖了各种任务,包括语言理解、常识推理、数学推理、总结、编码和生成真实答案的能力。附上相关测试结果如下:

参考

Lightweight Champ: NVIDIA Releases Small Language Model With State-of-the-Art Accuracy

Mistral-NeMo-Minitron 8B Foundation Model Delivers Unparalleled Accuracy

Compact Language Models via Pruning and Knowledge Distillation

阿里达摩院发布遥感AI大模型,可用于农业估产、地理灾害防治

10月20日消息,阿里达摩院发布业内首个遥感AI大模型,一个模型即可识别农田、农作物、建筑等地表万物,让AI进一步下沉到田间地头,大幅提升灾害防治、自然资源管理、农业估产等遥感应用的分析效率,该模型已在AIEart...

萨姆·奥特曼:人类水平的AI即将出现 但对世界的影响远比想象的小

1月17日消息,当地时间周二美国人工智能初创企业OpenAI首席执行官萨姆·奥特曼(SamAltman)表示,达到人类水平级别的人工智能即将出现,但它对世界的影响远没有我们想象的那么大。奥特曼表示,人们总担心人工智能有...

马斯克的xAI拿下60亿美元融资,准备对决OpenAI

2024是大模型供给侧出清的一年?伊隆·马斯克:我还没亮底牌,赢家怎么就能定了呢?刚刚,马斯克的xAI宣布了今年最大的一笔风险投资,以超过240亿美元估值获得60亿美元B轮融资。至此,硅谷大模型第一梯队的玩家再多...

人工智能冲击创意岗位,OpenAI首席技术官:一些岗位本来就不该存在

6月27日消息,人工智能就像一把达摩克利斯之剑,正威胁着越来越多的创意工作岗位。OpenAI的首席技术官米拉・穆拉蒂(MiraMurati)上个月在达特茅斯大学Thayer工程学院的采访中表示:“一些创意岗位可能会消失。但也许...

人工智能安全治理专委会正式成立 上海人工智能实验室、腾讯等联合发起

10月19日消息,近日,中国网络空间安全协会人工智能安全治理专业委员会成立大会在北京召开。据了解,该委员会由国家互联网应急中心、北京智源研究院、上海人工智能实验室、腾讯等单位联合发起,首批成员单位包含人工...

TAG:英伟达 AI
上一篇:有大佬曾吐槽搜索全广告!百度已有18%搜索结果由AI生成
下一篇:人形机器人进入量产阶段,价格已降至10万元以内