阿里云发布「通义千问2.0」:性能超GPT-3.5
10月31日消息,2023杭州云栖大会上,阿里云首席技术官周靖人正式发布千亿级参数大模型通义千问2.0。在10个权威测评中,通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4。当天,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。
通义千问2.0发布
周靖人介绍,过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前,通义千问的综合性能已经超过GPT-3.5,加速追赶GPT-4。
通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4
在MMLU、C-Eval、GSM8K、HumanEval、MATH等10个主流Benchmark测评集上,通义千问2.0的得分整体超越Meta的Llama-2-70B,相比OpenAI的Chat-3.5是九胜一负,相比GPT-4则是四胜六负,与GPT-4的差距进一步缩小。
中英文理解能力是大语言模型的基本功。英语任务方面,通义千问2.0在MMLU基准的得分是82.5,仅次于GPT-4,通过大幅增加参数量,通义千问2.0能更好地理解和处理复杂的语言结构和概念;中文任务方面,通义千问2.0以明显优势在C-Eval基准获得最高得分,这是由于模型在训练中学习了更多中文语料,进一步强化了中文理解和表达能力。
在数学推理、代码理解等领域,通义千问2.0进步明显。在推理基准测试GSM8K中,通义千问排名第二,展示了强大的计算和逻辑推理能力;在HumanEval测试中,通义千问得分紧跟GPT-4和GPT-3.5,该测试主要衡量大模型理解和执行代码片段的能力,这一能力是大模型应用于编程辅助、自动代码修复等场景的基础。
据介绍,通义千问更成熟了,也更好用了。通义千问2.0在指令遵循、工具使用、精细化创作等方面作了技术优化,能够更好地被下游应用场景集成。通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。
与此同时,基于通义大模型训练的8大行业模型组团上线,分别是:通义灵码-智能编码助手、通义智文-AI阅读助手、通义听悟-工作学习AI助手、通义星尘-个性化角色创作平台、通义点金-智能投研助手、通义晓蜜-智能客服、通义仁心-个人专属健康助手、通义法睿-AI法律顾问。
8大行业模型面向当下最受欢迎的多个垂直场景,使用领域数据进行专门训练。用户可以在官网直接体验模型功能,开发者可以通过网页嵌入、API/SDK调用等方式,将模型能力集成到自己的大模型应用和服务中。
通义大模型家族全面升级,8大行业模型组团上线
截至10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。
周靖人透露,阿里云计划近期开源通义千问72B版本,此前,阿里云已先后开源7B和14B版本模型,模型累计下载量超过100万。阿里云将持续支持千行百业的开发者基于通义千问开源模型进行模型和应用创新。
图:通义千问72B即将开源
字节掉队AI时代?开年Sora的爆火,为全球科技大厂在AI领域的竞逐又投下一颗重磅炸弹。相关话题的讨论范围早已突破科技圈。当“AI将重塑各行各业,并产生深远影响”成为一项共识,头部大厂正在竞速迈入AI时代。其中,也包括近年跻身全...
纯血鸿蒙推出,华为的反击时刻?华为终于在操作系统市场“挺直腰板”了。日前华为开发者大会上,HarmonyOSNEXT(原生鸿蒙)正式公布,且不依赖传统的Unix内核和Linux内核只靠自主的鸿蒙内核这点,意味着华为终于拥有自身的“纯血鸿蒙”,该系统商用...
海天味业回应进军AI:不要误会 是做酿造设备快科技1月15日消息,据国内媒体报道,海天味业1月11日新成立一家子公司天致(广东)工程技术有限公司,注册资本为1000万元,经营范围涉及工业工程设计服务、人工智能基础软件开发等。对此,市场有人猜测海天味业是否...
苹果高管称正寻找将Apple Intelligence引入中国市场的方法6月12日消息,苹果软件工程主管CraigFederighi(克雷格·费德里吉)在接受媒体采访时表示,正在寻找将AppleIntelligence(苹果智能)引入中国市场的方法。在日前举行的苹果WWDC24,苹果宣布推出AI方案:面向iPhone、...
Sora刷屏视频出现多处失误 OpenAI回应:正在积极改进自2月18日OpenAI发布文生视频AI工具Sora以来,其影响已逐渐渗透到科技圈、资本圈和影视圈等多个领域。众多专家和业内人士纷纷对其展开深入探讨,同时针对Sora目前存在的问题和不足也进行了深入研究。目前,Sora所生...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...