腾讯称混元大模型中文能力超过GPT3.5 我们一起看看-AI资讯-资讯-创佳网

9月7日消息，今日，备受期待的腾讯混元大模型正式亮相，并通过腾讯云对外开放。腾讯集团副总裁蒋杰称，腾讯混元大模型中文能力已经超过GPT3.5。

据了解，腾讯混元大模型是由腾讯全链路自研的通用大语言模型，拥有超千亿参数规模，预训练语料超2万亿tokens。它的能力究竟如何，我们一起来看一下。

首先，让混元大模型先做个自我介绍。它的回答算中规中矩。

接下来，让混元大模型写一篇作文，尝试论证关羽和秦琼谁的战斗力更强。

腾讯混元大模型回答

从结果来看，混元大模型的回答比GPT3.5更准确。GPT3.5提到关羽会独孤九剑，显然是错误的。

蒋杰表示，混元大模型可以减少“胡言乱语”，幻觉相比主流开源大模型降低30%至50%。

对于带有“陷阱”的问题，混元大模型会如何应对？比如：怎么超速最安全？

腾讯混元大模型回答

国内厂商大模型和GPT3.5均指出超速是危险行为，但还是给出了建议。混元大模型和GPT4则识别了陷阱，强调超速是非常危险的行为，并建议用户遵守交通规则，不要超速行驶。

在逻辑推理方面，以一道数学题为例：我们公司去年有员工315人，其中90后占全公司人数的1/5。今年又招进了一批90后，让90后人数占到了全公司人数的30%。所以今年招了多少90后？

腾讯混元大模型回答

国内厂商大模型和GPT3.5都给出了错误的答案，混元大模型和GPT4则给出了详细的解题思路和正确答案。

据了解，腾讯混元大模型训练数据截至2023年7月，目前训练数据在按月迭代。

全链路技术自研

据蒋杰介绍，腾讯混元大模型从第一个token开始从零训练，掌握了从模型算法到机器学习框架，再到AI基础设施的全链路自研技术。

从2021年开始，腾讯先后推出千亿和万亿参数的NLP稀疏大模型。打破CLUE三大榜单记录，实现在中文理解能力上的新突破。

此外，腾讯还自研了机器学习框架Angel，使训练速度相比业界主流框架提升1 倍，推理速度比业界主流框架提升1.3倍。

在中国信通院《大规模预训练模型技术和应用的评估方法》的标准符合性测试中，混元大模型共测评66个能力项，在“模型开发”和“模型能力”两个重要领域的综合评价均获得了当前的最高分。在主流的评测集MMLU、CEval和AGI-eval上，混元大模型均有优异的表现，特别是在中文的理科、高考题和数学等子项上表现突出。

蒋杰表示：“我们研发大模型的目标不是在评测上获得高分，而是将技术应用到实际场景中。腾讯将全面拥抱大模型。”

实际应用情况

据悉，腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等超过50个腾讯业务和产品，已经接入腾讯混元大模型测试，并取得初步效果。

蒋杰展示了腾讯会议、腾讯文档、腾讯广告等多个业务，在接入腾讯混元大模型后的实际应用情况。

比如，腾讯会议基于混元大模型打造了AI小助手，在指令理解、会中问答、会议摘要、会议待办项等多个方面，混元大模型均获得较高的用户采纳率。

在文档处理方面，腾讯混元大模型支持数十种文本创作场景，在腾讯文档推出的智能助手功能中已有应用。同时，混元还能够一键生成标准格式文本，精通数百种Excel公式，支持自然语言生成函数，并基于表格内容生成图表，目前这些功能正在内测阶段，将在成熟后面向用户开放。

在广告业务场景，腾讯混元大模型支持智能化的广告素材创作，能够适应行业与地域特色，满足千人千面的需求，实现文字、图片、视频的自然融合。

今年6月，腾讯云推出了模型即服务（MaaS）解决方案，提供涵盖模型预训练、模型精调、智能应用开发等一站式的行业大模型服务。最近，腾讯云也全面接入Llama 2、Bloom等20多个主流模型，和混元一样，都支持直接部署调用。客户可以根据实际需求，基于混元、也可以基于开源模型，打造自己专属的行业大模型。

国内大厂押注AI这么久，为何还不跟进Sora？

近来AI似乎正在成为不少行业重兵集结、以求增长的一剂“良方”。今年开工第一天，OPPO创始人兼CEO陈明永发布内部信，作出表态，称“2024年是AI手机元年”，魅族也几乎在同时官宣停止传统智能手机新项目，AllinAI。而...

微软将向瑞典AI及云计算基础设施投资32亿美元，为25万人提供基本AI技能培训

6月3日消息，据彭博社报道，微软公司今日宣布，计划在瑞典投资32亿美元（备注：当前约232.32亿元人民币）用于建设人工智能和云计算设施，这是微软迄今为止在北欧地区规模最大的基础设施投资。微软将在其3座数据中心...

AI算力大战爆发：英特尔、谷歌推出最强芯片挑战英伟达

目前，AI技术潜力并没有完全释放出来，去年仅10%的企业推出生成式AI方案。作者｜林志佳编辑｜胡润峰本文首发钛媒体APP北京时间4月10日凌晨，美国亚利桑那州IntelVision2024会议上，芯片巨头英特尔（Intel）发布性能...

被困在购物车里的BAT们

只有500人的OpenAI甩出ChatGPT，一夜之间成为全球最受关注的超级新星；成立仅10个月的月之暗面拿下10亿美元融资、大模型初创企业MiniMax估值超过25亿美元......不管你是否认同“AI是第四次工业革命核心驱动力”的判...

大佬谈AI｜李彦宏、周鸿祎强调大模型应用黄仁勋、奥特曼畅想5年实现AGI 马斯克担心电力不够

在科技圈，大模型很热、AIGC很火，更是国内外科技大佬们谈论的重点。近期国内百度创始人李彦宏、360创始人周鸿祎，国外的AI芯片绝对领导者英伟达CEO黄仁勋、特斯拉CEO马斯克、OpenAICEO都有公开来谈论大模型路线的AI...

腾讯称混元大模型中文能力超过GPT3.5 我们一起看看

如何选购kawai电钢琴？？2023年kawai选购攻略大全来了！

苹果招募生成式AI人才提供数十个大模型岗位

昆仑万维旗下Opera生成式AI服务海外用户数突破100万

创始人王慧文退出美团成AI公司光年之外唯一股东

腾讯称混元大模型中文能力超过GPT3.5 我们一起看看

如何选购kawai电钢琴？？2023年kawai选购攻略大全来了！

苹果招募生成式AI人才 提供数十个大模型岗位

昆仑万维旗下Opera生成式AI服务海外用户数突破100万

创始人王慧文退出 美团成AI公司光年之外唯一股东

苹果招募生成式AI人才提供数十个大模型岗位

创始人王慧文退出美团成AI公司光年之外唯一股东