阿里云宣布Qwen2开源 性能超美国开源模型Llama3

274096542024-06-07 11:12:08TechWeb.com.cn

6月7日消息,阿里云今日宣布,比美国开源Llama3和中国闭源模型们更强的Qwen2今日开源,免费下载。

阿里云表示:历经数月努力,我们很高兴迎来了Qwen系列模型从Qwen1.5到Qwen2的重大升级。这一次,我们为大家带来了:

* 5个尺寸的预训练和指令微调模型, 包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B;

* 在中文英语的基础上,训练数据中增加了27种语言相关的高质量数据;

* 多个评测基准上的领先表现;

* 代码和数学能力显著提升;

* 增大了上下文长度支持,最高达到128K tokens(Qwen2-72B-Instruct)。

Qwen2-72B-Instruct能够完美处理128k上下文长度内的信息抽取任务;Qwen2-7B-Instruct几乎完美地处理长达128k的上下文;Qwen2-57B-A14B-Instruct则能处理64k的上下文长度;而该系列中的两个较小模型则支持32k的上下文长度。

目前,上述Qwen2系列模型已在Hugging Face和ModelScope上同步开源。

阿里云强调,此次采用不同的模型许可。除了Qwen2-72B依旧使用此前的Qianwen License外,其余模型,包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B以及Qwen2-57B-A14B在内,均采用Apache 2.0的许可。我们希望本次开放程度的提升能够加速Qwen2在全球各地的落地及商业应用。

消息称苹果产品设计副总裁Tang Tan将加入LoveFrom 从事AI硬件项目

12月27日消息,据外媒报道,知情人士透露,将于明年2月离职的苹果产品设计副总裁TangTan将加入由苹果前首席工业设计官乔尼·艾维(JonyIve)创立的设计公司LoveFrom。据悉,LoveFrom是艾维在2019年离开苹果后创立的一...

扎克伯格:AI 数据中心 GPU 紧缺正在缓解,电力将成新瓶颈

IT之家5月13日消息,MetaCEO马克・扎克伯格(MarkZuckerberg)近日在接受油管DwarkeshPatel频道采访时表示,AI数据中心的GPU紧缺已在缓解过程中,未来的瓶颈将是电力供应。扎克伯格首先提到,此前一段时间,IT企业即...

占比44%,报告称OpenAI的GPT-4充斥大量版权内容

3月8日消息,根据PatronusAI近日发表的最新报告,OpenAI的GPT-4模型中包含大量的版权内容,其占比达到了44%。PatronusAI是一家专门评估大型语言模型(LLMs)的公司,本周三发布的报告中测试了四款主流AI模型:OpenAI...

AppLovin宣布AppDiscovery在AI方面进一步升级 提升营销效果

8月8日消息,营销平台AppLovin(纳斯达克代码:APP)今日宣布,旗下移动用户获取(UA)平台AppDiscovery在人工智能(AI)方面取得进一步升级。现在,AI能够使用更多强大的模型优化AppDiscovery平台的AXON引擎,帮助合作伙...

荣耀200 Pro评测:雅顾光影写真大师加持 媲美专业单反光影人像体验

【TechWeb评测】从荣耀品牌诞生以来,主打时尚外观和创新影像的数字系列就一直承担着自家“门面”的责任,深受广大用户尤其年轻消费者的喜爱。现在,荣耀正式带来了全新的荣耀200系列机型,包含荣耀200和荣耀200Pro...

上一篇:中山大学中山眼科中心与华为联合发布ChatZOC眼科大模型
下一篇:苹果跳出舒适圈,GitHub Copilot倒逼其在AI领域奋起直追