
阿里巴巴AI To C业务旗下AI应用「阿里通义」在6日正式发布最新的开源推理模型通义千问QwQ-32B,其官方介绍称,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上进步飞跃,整体性能比肩DeepSeek-R1,同时大幅降低部署使用成本,在消费级显卡上能实现本地部署。
用户已可免费下载及商用QwQ-32B模型,或通过网页版Qwen Chat体验,该模型也将免费上架通义App。
googletag.cmd.push(function() { googletag.display(‘div-gpt-ad-1694617103692-0’); });
阿里通义团队表示,QwQ-32B模型针对数学和编程任务、通用能力分别进行2轮大规模强化学习,在32B的模型尺寸上获得推理能力提升,印证了大规模强化学习(Reinforcement Learning,一种机器学习技术)可显著提高模型性能。
该团队指,千问QwQ-32B能提供极强的推理能力,以及满足更低的资源消耗需求,背后关键在于强化学习。该团队表示,希望能够证明强大的基础模型叠加大规模强化学习,也许是一条通往通用人工智能(AGI)的可行之路。
此外,QwQ-32B模型中还集成了与智能体(AI Agent,指的是能够自主做出决策、完成行动,且毋需人类介入的人工智能)相关的能力,能在使用工具的同时进行批判性思考,以及根据环境回馈调整推理过程。
受此消息影响,6日阿里巴巴集团港股早盘大幅高开涨逾6%,截至午盘涨逾7%。