DeepSeek V3升级了,新版本V3-0324。
官方轻描淡写只说是“小版本升级”,但很多人实测下来可一点也不小。
把流行的小球弹跳测试,提升难度到4维空间超立方体也没问题。
天哪,如果这只是一个小更新,那我想象不出大更新会是什么样子。
编程这块,只需一句提示词开发一个完整产品着陆页,带自适应布局带动效,被评价为与Claude 3.7 Sonnet同一水平。
由于发布时间太短,还没有正式测评结果,不过在开发者Xeophon的个人Benchmark上所有指标都有大提升,成为该测试下最好的非推理模型。
不是推理模型也有“啊哈时刻”
DeepSeek-V3-0324并非推理模型,在回答之前不会给出思考过程,但依然遵循一定的思维方式分解问题。
走入死胡同的话,还表现出自主回到上一步重新思考的能力。
在“9.11和9.9那个大”、“Straberry有多少个r”已经不成问题的今天,最新折磨AI的难题是“让7米长的甘蔗通过2米高1米宽的门”。
在测试中,DeepSeek-V3-0324先是像它的前辈以及许多其他AI一样碰壁。
碰壁之后开始重新思考题目本身的含义,后面依旧陷入误区,但突然在中文解题过程中夹杂一句英语思考,类似DeepSeek-R1技术报告中的“啊哈时刻”。
等等,这似乎与之前的对角线方法相似,也许我遗漏了什么。
顿悟之后,突然就走上了正确的道路,注意到了题目中没直接提到的隐藏条件。
虽然从计算过程看,还是没理解到问题的本质,但好歹得出了解决方案,还认识到了自己的误区。
依旧免费, 依旧开源
像这样的优秀模型依旧免费, 依旧开源,权重文件已火速上线HuggingFace,使用最宽松的MIT协议。
所有权重文件加起来占硬盘空间约688GB,与初代v3保持一致,说明依然是671B参数的MoE模型,目前没有更多技术细节,还需等待官方进一步发布公告。
目前在官网和官方APP(关闭深度思考即可)、HuggingFace等渠道都能体验到v3-0324。
也可以到大模型竞技场去与其他模型pk,不过投票结果还要等一段时间才能出来。
当然最让大家期待的还是,v3更新了,r2还会远吗?
官网试玩:
https://chat.deepseek.com/
HuggingFace:
https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/blob/main/README.md
(相关资料图)11月8日上午,国轩高科子公司合肥国轩科宏新能源科技有限公司(下称“国轩科宏”)正极材料投产仪式在合肥庐江高新区举行,这也是庐江的首个百亿项目。该项目位于合肥市庐江县国轩材料基地,主要产品为国轩高科自主研发的单体电芯能量密度≥210Wh/kg的高性能磷酸铁锂正极材料,应用于高端新能源汽...
11-15
(资料图片仅供参考)进入11月,电哥依旧为大伙儿整理了10月销量榜单,看看这一期的排名和你预想中有多少差别吧:有意思是:又有新人加入了榜单,有的品牌表现极为稳定,当然也少不了波动非常剧烈的选手。Tips:排名统计时间截止到11月3日,未公布品牌尚未纳入榜单另外,电哥也附上9月榜单(截止10月2日统计...
11-15
(相关资料图)来源:人民网原创稿人民网北京11月10日电(记者王连香)今日,中国汽车工业协会发布10月汽车工业产销情况,数据显示,10月,汽车产销延续平稳发展态势。当月产销分别达到259.9万辆和250.5万辆,环比下降2.7%和4%,同比增长11.1%和6.9%。由于车辆购置税减征政策的持续发...
11-15
(资料图)平行世界是否真实存在?另外一个世界的你自己是不是已经过上了非常幸福的生活,已经走上了人生的巅峰,而处在这个世界的你正在受尽社会的毒打。这种平行宇宙的理论到底是怎么来的呢?为什么科学家又会定义平行宇宙的存在呢?我们今天一起来了解一下量子世界中的平行宇宙到底是什么样子的?我们大家都知道在量子世...
11-15
(资料图)11月8日晚,甬金股份(603995)公告,拟设立全资子公司“浙江镨赛新材料科技有限公司”,投资建设“年产22.5万吨柱状电池专用外壳材料项目”,计划总投资额约14亿元。该项目分两期建设,其中一期工程建设期12个月,建成年加工7.5万吨柱状电池外壳专用材料生产线,二期工程建设期18个月,建...
11-15