阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
3月6日消息,阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。
这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。
QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下,用强化学习实现了性能上的跨越。
此外,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。
QwQ-32B 在一系列基准测试中进行了评估,测试了数学推理、编程能力和通用能力。
其中,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。
同时,在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek- R1。
目前,QwQ-32B已在Hugging Face和ModelScope开源,大家也可通过Qwen Chat直接进行体验!(随心)
脉脉CEO林凡:AI人才争夺战蔓延至多个行业11月30日消息,近日脉脉创始人兼CEO林凡出席WISE2023商业之王大会并发表《逆风智行,大模型时代的人才挑战》主题演讲。林凡透露,包括互联网在内的多个行业都在争夺AI人才,AI人才供需比低至0.4,相当于5家企业争夺2...
传DeepSeek 首次考虑进行外部融资 官方回应来了2月20日消息,DeepSeek最近的爆火,引发了科技圈甚至是全民的高度关注。近日有媒体报道,知情人士透露,DeepSeek正在考虑首次外部融资。针对此消息,DeepSeek相关人士辟谣,融资消息均为谣言。根据此前报道称,最近...
美国众议院禁止工作人员使用微软AI助手Copilot,存泄密风险3月31日消息,据Axios报道,美国国会众议院出于安全考量,禁止其工作人员在工作设备上使用微软的Copilot生成式人工智能辅助工具。美国众议院首席行政官凯瑟琳・斯平多(CatherineSzpindor)在发送给工作人员的指导意见...
丰田研究所与波士顿动力合作,推进机器人大规模行为模型等研究10月17日消息,波士顿动力与丰田研究所(注:简称TRI)当地时间16日宣布达成合作,双方将在人工智能与机器人技术领域展开合作。此次合作将结合TRI的大规模行为模型与波士顿动力的Atlas机器人,旨在加速通用人形机器...
消息称苹果在最后时刻退出OpenAI新一轮融资 但不会影响双方现有合作9月29日消息,据外媒报道,上月底有消息称,在生成式人工智能领域走在行业前列的OpenAI,在寻求进行一轮数十亿美元的融资,以提升算力和运营能力,估值可能超过1000亿美元,随后的消息显示OpenAI在洽谈以1500亿美元...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...