阿里开源千问3向量模型:性能狂增40%干翻谷歌、OpenAI

xiansanguoke2025-06-06 12:01:27快科技

6月6日消息,阿里正式开源了通义千问3全新的向量模型系列Qwen3-Embedding(简称千问3向量模型)。

该模型以千问3为底座,专门为文本表征、检索和排序等核心任务进行优化训练,相较于上一个版本,在文本检索、聚类、分类等核心任务上提升最高40%以上的性能。

在MTEB等专项榜单中,Qwen3-Embedding-8B超越谷歌的Gemini Embedding 、Open AI的 text-embedding-3-large及微软的multilingual-e5-large-instruct等顶尖模型,拿下同类模型的最佳性能SOTA。

向量模型可以看做是AI的“翻译器”,它可以将文本、图片等非结构化信息,映射(embedding)到机器更易理解的向量空间,再基于这些向量实现高效的信息分类、检索或排序。

基于千问3模型,通义团队通过对比训练、SFT、模型融合等方法,打造出全新的千问3向量模型,包含文本嵌入模型Qwen3-Embedding 以及文本排序模型Qwen3-Reranker。

同时,得益于千问3的多语言能力,千问3向量模型系列率先支持超100种语言,并涵盖多种编程语言,可实现强大的多语言、跨语言及代码检索能力。

此次共有9款千问3向量模型开源,涵盖0.6B、4B 、8B等不同尺寸及GGUF版本,开发者可从中找到最符合需求的模型,自由组合模块,还可自定义向量或指令,实现特定任务、语言和场景的深度优化。

目前,千问3 Embedding和Reranker模型均已在魔搭社区、 Hugging Face和GitHub等平台上开源,开发者也可直接通过阿里云百炼使用API服务。

据了解,千问3大模型自4月29日开源以来,已揽获Artificial Analysis、LiveBench、LiveCodeBench、SuperClue多个榜单的全球开源冠军。(黑白)

2024外滩大会闭幕 属于AI选手和创新者的故事才刚刚开始

9月7日消息,2024Inclusion·外滩大会今日闭幕,据统计,三天时间内,有30余项AI新成果在大会发布,包括蚂蚁AI生活管家“支小宝”、AI金融管家“蚂小财”,AI健康管家,支付宝智能体开发平台“百宝箱”、网商银行“...

Omdia:人形机器人今年迎来突破之年,2027年全球出货将破万台

8月1日消息,根据Omdia7月25日发布的研究报告,预计到2027年,全球人形机器人出货量将超过10000台,到2030年将达到38000台,这意味着人形机器人2024-2030年的复合年增长率将达到83%。该机构指出,人形机器人是下一个...

百川智能推出角色大模型Baichuan-NPC 可实现游戏动漫等领域角色定制

1月9日消息,百川智能发布角色大模型Baichuan-NPC,该模型深度优化了“角色知识”和“对话能力”,使模型能够更好的理解上下文对话语义,更加符合人物性格地进行对话和行动,让角色栩栩如生。此外,对于游戏领域AI角...

OpenAI收购域名Chat.com 后者价值逾1500万美元

11月7日消息,据外媒报道,AI巨头OpenAI收购了域名Chat.com,OpenAI发言人通过电子邮件证实了此次收购,但拒绝披露交易价格。Chat.com此前的交易价格显示,其价值逾1500万美元。目前,Chat.com重定向到OpenAI的人工...

OpenAI宣布向所有用户免费开放ChatGPT语音功能

12月22日消息,据外媒报道,OpenAI宣布向所有用户免费开放ChatGPT语音功能。这意味着用户可以与ChatGPT进行自然的语音对话,而无需支付任何费用。据悉,该功能于今年9月份推出,以前只向使用iPhone或iPad的ChatGPTPl...

TAG:阿里 AI
上一篇:AMD收购近内存计算 AI 推理芯片团队Untether AI
下一篇:马斯克:特斯拉下一代AI芯片Dojo 2将于“今年晚些时候”上线