塔岸网

阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1

热度:4℃ 发布时间:2025-03-10 22:10:05

快科技3月6日消息,阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。

这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。

QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下,用强化学习实现了性能上的跨越。

此外,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。

阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1

QwQ-32B 在一系列基准测试中进行了评估,测试了数学推理、编程能力和通用能力。

其中,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。

同时,在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek- R1。

目前,QwQ-32B已在Hugging Face和ModelScope开源,大家也可通过Qwen Chat直接进行体验!

(window.slotbydup = window.slotbydup || []).push({id: "u6501951",container: "_brvvnx0iwme",async: true });
  • 科技资讯推荐
更多+
当前视点!国轩高科百亿高端正极材料项目投产

当前视点!国轩高科百亿高端正极材料项目投产

(相关资料图)11月8日上午,国轩高科子公司合肥国轩科宏新能源科技有限公司(下称“国轩科宏”)正极材料投产仪式在合肥庐江高新区举行,这也是庐江的首个百亿项目。该项目位于合肥市庐江县国轩材料基地,主要产品为国轩高科自主研发的单体电芯能量密度≥210Wh/kg的高性能磷酸铁锂正极材料,应用于高端新能源汽...

11-15

当前热点-10月销量榜出炉!排名发生剧变,这个品牌近乎腰斩

当前热点-10月销量榜出炉!排名发生剧变,这个品牌近乎腰斩

(资料图片仅供参考)进入11月,电哥依旧为大伙儿整理了10月销量榜单,看看这一期的排名和你预想中有多少差别吧:有意思是:又有新人加入了榜单,有的品牌表现极为稳定,当然也少不了波动非常剧烈的选手。Tips:排名统计时间截止到11月3日,未公布品牌尚未纳入榜单另外,电哥也附上9月榜单(截止10月2日统计...

11-15

快报:我国汽车行业发展环境持续向好 10月份汽车销量同比增长6.9%

快报:我国汽车行业发展环境持续向好 10月份汽车销量同比增长6.9%

(相关资料图)来源:人民网原创稿人民网北京11月10日电(记者王连香)今日,中国汽车工业协会发布10月汽车工业产销情况,数据显示,10月,汽车产销延续平稳发展态势。当月产销分别达到259.9万辆和250.5万辆,环比下降2.7%和4%,同比增长11.1%和6.9%。由于车辆购置税减征政策的持续发...

11-15

世界今头条!量子世界中的平行宇宙到底是什么样子的?

世界今头条!量子世界中的平行宇宙到底是什么样子的?

(资料图)平行世界是否真实存在?另外一个世界的你自己是不是已经过上了非常幸福的生活,已经走上了人生的巅峰,而处在这个世界的你正在受尽社会的毒打。这种平行宇宙的理论到底是怎么来的呢?为什么科学家又会定义平行宇宙的存在呢?我们今天一起来了解一下量子世界中的平行宇宙到底是什么样子的?我们大家都知道在量子世...

11-15

上市公司拟投建超22万吨电池专用外壳材料项目

上市公司拟投建超22万吨电池专用外壳材料项目

(资料图)11月8日晚,甬金股份(603995)公告,拟设立全资子公司“浙江镨赛新材料科技有限公司”,投资建设“年产22.5万吨柱状电池专用外壳材料项目”,计划总投资额约14亿元。该项目分两期建设,其中一期工程建设期12个月,建成年加工7.5万吨柱状电池外壳专用材料生产线,二期工程建设期18个月,建...

11-15

网友评论
评论
发 布

更多科技资讯