首页 > 科技>V4还没来 DeepSeekMath-V2数学模型来了：IMO奥赛金牌水平

V4还没来 DeepSeekMath-V2数学模型来了：IMO奥赛金牌水平

快科技科技2025-11-28 07:09:21

快科技11月27日消息，全网都在等DeepSeek发布V4大模型，然而好事多磨，这个模型一直没有问世，但DeepSeek也没闲着，时不时来个惊喜，今晚突然低调发布了DeepSeekMath-V2模型。DeepSeekMath-V2...

快科技11月27日消息，全网都在等DeepSeek发布V4大模型，然而好事多磨，这个模型一直没有问世，但DeepSeek也没闲着，时不时来个惊喜，今晚突然低调发布了DeepSeekMath-V2模型。

DeepSeekMath-V2是一款可自我验证的数学推理训练框架，基于 DeepSeek?V3.2?Exp?Base训练而来，通过LLM验证器自动审查生成的数学证明，并利用高难度样本持续优化性能。

目前该模型代码与权重已开源，发布于Hugging Face及GitHub平台。

V4还没来 DeepSeekMath-V2数学模型来了：IMO奥赛金牌水平

这款模型强在哪里？先说结果，在IMO 2025和CMO 2024中均达到金牌水平，Putnam 2024获118/120分。

如果对比当前顶级的大模型，比如Claude Sonnet4、GPT-5、Gemini 2.5 Pro等，Basic测试中得分被DeepSeekMath-V2的99分远远甩开，Adveanced中也只比Gemini DeepThink的65.7分略低，这个模型也是谷歌特调的，也达到到了IMO金牌水平。

考虑到DeepSeekMath-V2的开源、免费等特性，可以说它是当前最强的数学模型了。

不过DeepSeek官方的说法倒是很谦虚，表示尽管仍有许多工作需要完成，这些结果表明，自我可验证的数学推理是一个可行的研究方向，可能有助于开发更强大的数学AI系统。

如果联系到DeepSeek最近几款特殊模型的表现，显然他们在V4发布之前积累了相当多的新技术新想法，在OCR、数学等方面表现惊艳，这么一想V4如果是全能型的多模态大模型，那就更值得期待了。

V4还没来 DeepSeekMath-V2数学模型来了：IMO奥赛金牌水平

《V4还没来 DeepSeekMath-V2数学模型来了：IMO奥赛金牌水平》转载自互联网，如有侵权，联系我们删除，QQ：369-8522。

本文网址：https://m.jsj.wang/2025/11/17642849801102.html

单月仅次于小米YU7！方程豹钛7上市80天累销超5万辆

快科技11月27日消息，谁也没想到，方程豹最走量的车型出现了，它正是今年上市刚满80天的钛7。官方数据显示，截至目前该车累计销量超过5万辆，并且在10月份销量破2万辆，成为了仅次于YU7的畅销...

科技 2025-11-28 0
新研究：长期少量喝酒等于慢性自杀喝酒脸红的人更易患癌

11月27日消息，最新的研究显示，长期少量喝酒等于慢性自杀。《柳叶刀》杂志上的研究指出，每日饮酒20~60g，就属于危险饮酒，与39.4%的癌症发生相关。而且，长期喝白酒会对身体带来全方位的伤...

科技 2025-11-28 0
全球首个！我国自研气溶胶-气象耦合预报AI模型试运行

快科技11月27日消息，据央视新闻报道，为精准预报西北地区沙尘天气过程，日前，全球首个气溶胶-气象耦合预报人工智能模型投入试运行，可每天两次更新分辨率达5公里的沙尘预报产品，更精准预报局...

科技 2025-11-28 0
你中招没！武汉疾控：今年流感毒株不同传染性强 1968年曾引起世界流感大流行

快科技11月27日消息，“刀片嗓”、“水泥鼻”轮番上阵，身边请假的朋友同事日渐增多，今年的流感来势汹汹。日前，武汉疾控发文提醒，与上一流行季是以甲型H1N1亚型为主要...

科技 2025-11-28 0
男子处理海鲜被扎伤几天后突然去世！这些雷区你得知道

很多人爱吃海鲜，清蒸、白灼、红烧等，光是想想就让人流口水。可是在这些“鲜香背后”，也藏着不少被忽视的危险。尤其是清洗、剖开、处理海鲜和河鲜时——不经意的刺伤，...

科技 2025-11-28 0
九机并联！蓝箭航天可回收火箭朱雀三号首飞定档

快科技11月27日消息，据媒体报道，北京蓝箭航天自主研发的“朱雀三号”运载火箭已进入首飞倒计时，计划于11月29日实施首次发射。此次任务若取得成功，将标志着我国在可重复使用运载火...

科技 2025-11-28 0