一个好消息,时隔俩月, DeepSeek 终于更新了。
就在昨天晚上, DeepSeek 一声不吭往 Hugging Face 上扔了个 DeepSeek -V3-0324 模型。
模型参数 6850 亿,跟上一个版本的 V3 ( 6710 亿 )相差不大,采用 MoE 架构,还支持了更开放的 MIT 开源协议。
根据官方更新的版本说明, DeepSeek -V3-0324 主要是针对推理能力和前端开发能力进行了加强,写作风格实现了跟 R1 对齐,另外还有一些其他方面的小优化。
现在打开 DeepSeek 官网,把深度思考模式关掉就能直接用上 V3-0324 。
不过有一说一,虽然 V3-0324 仅仅只是 V3 的小版本升级,并不是大伙儿期待已久的 V4 或者 R2 ,且官方账号也没有发布任何跟模型有关的信息。
但也丝毫不妨碍, V3-0324 一上线,就有人说他的代码能力,直追克劳德。
新版本的模型刚一上传,就登上了 Hugging Face 的趋势榜单。
在国外大模型竞技场 KCORES 的测评中, V3-0324 的代码能力得分 328.3 ,超过了普通版的 Claude 3.7 Sonnet 的 322.3 分,接近 Claude 3.7 Sonnet 思维链版本的 334.8 分,排名第三。
图源 @karminski 牙医
重点是,排名在前面的模型压根就没几个开源免费的, V3-0324 可谓是一枝独秀。
所以在 V3-0324 上线不到一天的时间里,就已经有很多老哥迫不及待上手测评了一波。
这么说吧, V3-0324 在这些人手里,已经成了拳打 o3-mini ,脚踢 Claude 3.7 Sonnet 的存在。
经典的小球弹跳测试中,这位老哥把 V3-0324 、 o3-mini 和 R1 拉了个横评。
o3-mini 刚开始看着还不赖,但估计物理没学好,外面的六边形都转到垂直的位置了,球还不知道往下掉。
R1 的表现,也是有些让人摸不着头脑。。
相对来说, V3-0324 生成的结果是表现最好的,这位老哥丝毫不吝啬对它的夸奖,说它 “ 表现得像唯一排名第一的非推理模型 ” 。
让 V3-0324 生成一个网页,模型一口气写了 800 多行代码,运行的时候还没有出错,这什么实力不用多说了吧。
在评论区底下,有人仅仅下达了编写登录页面的简单指令,并没有任何其他的附加提示,同样也生成了一个完整的登录页面。
还说 V3-0324 在编码上,能跟 Claude 3.7 Sonnet 掰一掰手腕。
更别提其他的模型,性价比各方面相比下来,现在 OpenAI 的 o1-pro 和 GPT-4.5 ,都已经不香了。
反正看了几个网友的测试案例之后,世超对 V3-0324 的前端代码生成能力,已经有了初步的判断。
但不管咋说,没亲自上过手的东西,咱硬夸也有点心虚。所以这次世超也打算简单试一试,看看 V3-0324 到底有多能打。
一上来,世超就让模型做了一个画板,提示词是 “ 帮我用 HTML 代码构建一个画板,支持鼠标绘制、橡皮擦功能和颜色选择 ” ,这次出战的模型是 V3-0324 和普通版 Claude 3.7 Sonnet 。
只能说,这把 Claude 3.7 Sonnet 赢得很彻底。光是有取色器这一点,就甩了 V3-0324 不知道几个车尾灯。
更别提 UI 设计了, V3-0324 做出来的画板让世超不是很有创作的欲望。。。
世超着实是没想到,这盆凉水来得这么快,都让我有点怀疑到底是我的提示词没写好,还是模型有问题了。。。
不过,我后面又继续把小球弹跳的提示词,分别喂给了 DeepSeek-V3-0324 、普通版 Claude 3.7 Sonnet 还有 DeepSeek-V3 。
这下味儿终于对了。V3-0324 生成的结果确实牛叉,能很清楚地看到小球在下落触底的时候,产生了小幅度的弹跳。
就是吧,老版本的 V3 压根没运行起来。。。只能说两个版本之间的差距高下立判了。
再来看普通版 Claude 3.7 Sonnet 的结果,优点是底下的转速、重力和摩擦力都是可调节的,弹跳看起来也没什么大问题,但小球有点出画面了。。。
最后,世超又分别让 V3 和 V3-0324 生成一个 Saas 登录页面,提示词就一句话,没有任何的附加信息。
可以看到, V3 的页面倒是做出来了,但没什么设计可言。
反观 V3-0324 ,果然就跟官方的版本更新说明一样,生成的网页更美观了。
综合看下来, V3-0324 的代码能力相比 V3 确实有了比较大的提升,而且在一部分测试案例中,也能够比肩普通版 Claude 3.7 Sonnet 。
但如果要说完全超越 Claude 3.7 Sonnet ,那世超觉着暂时还不太行。
不过大伙儿也别忘了, V3-0324 在开源这个赛道里, V3-0324 已经算得上能打的了。
而且 DeepSeek 的 API 价格业主打的一个便宜。世超对比了 Claude 3.7 Sonnet 和 V3-0324 的 API 价格, V3-0324 百万 tokens 输入的价格是 2 元,百万 tokens 输出的价格是 8 元,而同样的 tokens 数, Claude 3.7 Sonnet 的输入和输出价格分别是 36.6 元和 108.9 元,价差最多有 18 倍。
所以在某种程度上, V3-0324 这个小更新,的确可以跟 Claude 3.7 Sonnet 媲美。
特别是今天晚上,DeepSeek官方还发文,正式介绍了这波小更新,在数学、代码类的相关评测上, V3-0324比OpenAI目前最厉害的非推理模型GPT-4.5都要更胜一筹。
去年 12 月底 V3 上线,紧接着 R1 就在过年的时候上桌吃饭了。如果按照 DeepSeek 之前发布模型的节奏,盲猜一波 R2 也快了。
总之,小版本更新的 V3-0324 就已经如此强悍了,就是不知道,在 DeepSeek 猛烈的开源炮弹下, “OpenAI 们 ” 还遭不遭得住了。
撰文:西西
编辑:江江&面线
美编:萱萱
图片、资料来源:
DeepSeek、X、Reddit
《ADH101登录入口最新》,《y85ouztigy6ysf5y》
免费AV视频曰本AV无码国产偷
“裸体裸乳🍑日本视频”
好大好湿硬顶到了的好爽视频
……
04月04日
“王馨瑶裸体㊙️无遮挡胸视频”Believe-通往你的桥-
↓↓↓
04月04日,跨越万里的奔赴,美女搂着小奶头❌❌❌小说,脱静香摸小内内出来水,同性男男黄Gary片免费有腹肌,鞠婧祎被❌喷水18禁
04月04日,巴西里约热内卢强风暴致9人遇难,女S男M✅在线观看网站,男生困困放入女生坤坤电视剧,丝袜老师踩我的🐔出精漫画,❌大胸❌女仆❌
04月04日,香港与新加坡签署防控传染病合作备忘录,13岁女孩全身光检查,欧老太做爰❌❌❌❌亚洲性猛交,女性㊙️黄www网站,疯狂挺进旗袍老师的软肉动漫
04月04日|“龟甲牛骨上的精灵——甲骨文艺术展”亮相南非|托奶比赛视频大全|小舞被❌脱脱内内打扑克3D动漫|男c女🔞黄㊙️❌B站17c|男男nanku
04月04日|“中国温泉之乡”广东龙门万人同泡“三伏浴”|白丝洗澡裸体被羞羞网站|V66AV美女露大乳揉下部秘|国产51精品㊙️入口福利一姬|美女校🌸让我C爆
04月04日|长沙18岁脑瘫少年居家自学 坚强母亲陪读助其圆大学梦|成人做爰黄A片免费看内衣|小🐔🐔伸进🈲🔞🔞漫画|神里绫华扒开粉嫩小屁股|小12楼裸体掀开裙子自慰……
04月04日,深港双向奔赴再迎小高峰,18🈲🍆🍑有套直国产,男同志gy🔞www.在线观看,搡BBBB搡BBB小说图,videos❌❌❌少妇公交车
04月04日,【小新的Vlog】“沉浸式”体验舰艇开放!带你了解海军的工作生活,同性Gay❌❌❌做受2022,亲妺妺的小泬让我进去微博,成人国产精品㊙️在线看明星合成,唐舞桐裸乳被爆❌白浆的
04月04日|万千气象看中国 | 新质生产力,正发力!|男生🍌弄女生🍑里免费|性亚洲老奶大老妇HD|劳拉成人3D动漫H版女同|丝袜视频❌Xx免费观看
04月04日,山西运城:立夏至 “晋南粮仓”农事忙,爆乳91女仆技女水,3D动漫精品蒂法一区二区免费,少萝被❌狂揉大胸视频,91在线无码㊙️入口在线
04月04日,“妈妈岗”来了,她们的就业焦虑缓解了吗?,动漫爆乳❌❌3D扶她,18🈲🍆🍑无套直香蕉,涂山红红裸体被❌叫爽漫画,丝袜老师妈妈的羞耻堕落在线观看
04月04日,斯洛伐克国家交响乐团南昌首场演出 奏响“新年乐章”,大学生自慰AV片又黄又爽APP,美女被捆绑㊙️,91精品一区二区三区蜜桃,惩罚拨开🍑用冰块小说
04月04日|感受大运河魅力,2024北京城市副中心马拉松开跑|小🐔🐔伸进🈲🔞🔞菠萝|男男Gay🔞捆绑网站戴套过程|动漫鬼父2爱莉全集免费观看|madout2bco11路5
04月04日|如何享受国家公园红利?三江源国家公园综合施策|Lisa裸体全乳露出原视频|51国精产品㊙️一区二区三区|法国理伦片巜粉嫩小娇乳小说|爽躁多水快深点叫
04月04日|众星云集第十七届亚洲电影大奖颁奖典礼 张艺谋获“终身成就奖”|欧美熟妇潮喷❌❌❌|亚洲AV㊙️无码一区小宵|3D宁荣荣被❌到爽动蓝莓视频|喷🔞🈲🍌流水高c
红毯先生 娱乐圈名场面,《变形金刚:起源》首曝预告|台湾史进上海校园活动举行:阅见历史 开创未来|云悠悠被强❌图黄漫|免费无遮挡🔞漫画视频|Free HD XXXX movies|肉体Bβββββ肉交
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺