英伟达发布80亿参数新AI模型:精度、效率高,可在RTX工作站上部署
8 月 23 日消息,英伟达于 8 月 21 日发布博文,发布了 Mistral-NeMo-Minitron 8B 小语言 AI 模型,具备精度高、计算效率高等优点,可在 GPU 加速的数据中心、云和工作站上运行模型。
英伟达携手 Mistral AI 上月发布开源 Mistral NeMo 12B 模型,在此基础上英伟达再次推出更小的 Mistral-NeMo-Minitron 8B 模型,共 80 亿个参数,可以在搭载英伟达 RTX 显卡的工作站上运行。
英伟达表示通过宽度剪枝(width-pruning)Mistral NeMo 12B,并知识蒸馏(knowledge distillation)轻度重新训练后获得 Mistral-NeMo-Minitron 8B,相关成果发表在《Compact Language Models via Pruning and Knowledge Distillation》论文中。
剪枝通过去除对准确率贡献最小的模型权重来缩小神经网络。在 "蒸馏" 过程中,研究小组在一个小型数据集上重新训练剪枝后的模型,以显著提高通过剪枝过程而降低的准确率。
就其规模而言,Mistral-NeMo-Minitron 8B 在语言模型的九项流行基准测试中遥遥领先。这些基准涵盖了各种任务,包括语言理解、常识推理、数学推理、总结、编码和生成真实答案的能力。附上相关测试结果如下:
参考
Lightweight Champ: NVIDIA Releases Small Language Model With State-of-the-Art Accuracy
Mistral-NeMo-Minitron 8B Foundation Model Delivers Unparalleled Accuracy
Compact Language Models via Pruning and Knowledge Distillation
阿里达摩院发布遥感AI大模型,可用于农业估产、地理灾害防治10月20日消息,阿里达摩院发布业内首个遥感AI大模型,一个模型即可识别农田、农作物、建筑等地表万物,让AI进一步下沉到田间地头,大幅提升灾害防治、自然资源管理、农业估产等遥感应用的分析效率,该模型已在AIEart...
萨姆·奥特曼:人类水平的AI即将出现 但对世界的影响远比想象的小1月17日消息,当地时间周二美国人工智能初创企业OpenAI首席执行官萨姆·奥特曼(SamAltman)表示,达到人类水平级别的人工智能即将出现,但它对世界的影响远没有我们想象的那么大。奥特曼表示,人们总担心人工智能有...
马斯克的xAI拿下60亿美元融资,准备对决OpenAI2024是大模型供给侧出清的一年?伊隆·马斯克:我还没亮底牌,赢家怎么就能定了呢?刚刚,马斯克的xAI宣布了今年最大的一笔风险投资,以超过240亿美元估值获得60亿美元B轮融资。至此,硅谷大模型第一梯队的玩家再多...
人工智能冲击创意岗位,OpenAI首席技术官:一些岗位本来就不该存在6月27日消息,人工智能就像一把达摩克利斯之剑,正威胁着越来越多的创意工作岗位。OpenAI的首席技术官米拉・穆拉蒂(MiraMurati)上个月在达特茅斯大学Thayer工程学院的采访中表示:“一些创意岗位可能会消失。但也许...
人工智能安全治理专委会正式成立 上海人工智能实验室、腾讯等联合发起10月19日消息,近日,中国网络空间安全协会人工智能安全治理专业委员会成立大会在北京召开。据了解,该委员会由国家互联网应急中心、北京智源研究院、上海人工智能实验室、腾讯等单位联合发起,首批成员单位包含人工...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...