阿里推出全新推理模型：仅1/21参数媲美DeepSeek R1-AI资讯-资讯-创佳网

3月6日消息，阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。

这是一款拥有320亿参数的模型，其性能可与具备6710亿参数（其中370亿被激活）的DeepSeek-R1媲美。

QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下，用强化学习实现了性能上的跨越。

此外，阿里还在推理模型中集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。

QwQ-32B 在一系列基准测试中进行了评估，测试了数学推理、编程能力和通用能力。

其中，在测试数学能力的AIME24评测集上，以及评估代码能力的LiveCodeBench中，千问QwQ-32B表现与DeepSeek-R1相当，远胜于o1-mini及相同尺寸的R1 蒸馏模型。

同时，在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中，千问QwQ-32B的得分均超越了DeepSeek- R1。

目前，QwQ-32B已在Hugging Face和ModelScope开源，大家也可通过Qwen Chat直接进行体验！（随心）

11月30日消息，近日脉脉创始人兼CEO林凡出席WISE2023商业之王大会并发表《逆风智行，大模型时代的人才挑战》主题演讲。林凡透露，包括互联网在内的多个行业都在争夺AI人才，AI人才供需比低至0.4，相当于5家企业争夺2...

2月20日消息，DeepSeek最近的爆火，引发了科技圈甚至是全民的高度关注。近日有媒体报道，知情人士透露，DeepSeek正在考虑首次外部融资。针对此消息，DeepSeek相关人士辟谣，融资消息均为谣言。根据此前报道称，最近...

3月31日消息，据Axios报道，美国国会众议院出于安全考量，禁止其工作人员在工作设备上使用微软的Copilot生成式人工智能辅助工具。美国众议院首席行政官凯瑟琳・斯平多(CatherineSzpindor)在发送给工作人员的指导意见...

10月17日消息，波士顿动力与丰田研究所（注：简称TRI）当地时间16日宣布达成合作，双方将在人工智能与机器人技术领域展开合作。此次合作将结合TRI的大规模行为模型与波士顿动力的Atlas机器人，旨在加速通用人形机器...

9月29日消息，据外媒报道，上月底有消息称，在生成式人工智能领域走在行业前列的OpenAI，在寻求进行一轮数十亿美元的融资，以提升算力和运营能力，估值可能超过1000亿美元，随后的消息显示OpenAI在洽谈以1500亿美元...

阿里推出全新推理模型：仅1/21参数媲美DeepSeek R1