C114讯 3月6日音讯(颜翊)今天,阿里旗下通义千问Qwen推出最新的推理模型 QwQ-32B。这是一款具有 320 亿参数的模型,其功能可与具有 6710 亿参数(其间 370 亿被激活)的 DeepSeek-R1 比美。
QwQ-32B 在一系列基准测验中进行了评价,测验了数学推理、编程才能和通用才能。测验成果为,QwQ-32B 的功能和 DeepSeek-R1-671B 平起平坐,远胜于相同尺度的R1蒸馏模型。

通义千问标明,期望能够证明强壮的根底模型叠加大规划强化学习也许是一条通往通用AI的可行之路。
其近期的研讨标明,强化学习能够明显提高模型的推理才能。例如,DeepSeek-R1 经过整合冷启动数据和多阶段练习,完成了最先进的功能,使其能够有用的进行深度考虑和侦查推理。

阿里巴巴散步宣告将竭尽全力加快云和AI硬件根底设施建造。阿里巴巴集团CEO吴泳铭标明,未来三年,阿里将投入超越3800亿元,用于建造云和AI硬件根底设施,总额超越去十年总和。这也创下我国非公有制企业在云和AI硬件根底设施建造范畴有史以来规划最大出资纪录。