截胡 OpenAI:谷歌率先公测“奥数金牌级”推理 AI 模型 Gemini 3 Deep Think
最新 12 月 5 日消息,科技媒体 NeoWin 今天(12 月 5 日)发布博文,报道称谷歌面向 Gemini Ultra 订阅(月费 249.99 美元)用户,推出了 Gemini 3 Deep Think(深度思考)模式。
相比较标准版 Gemini 3 Pro 模型,Deep Think 模式调用了更多计算资源,并采用了全新技术架构。该功能目前已完全集成至 Gemini App 中,Google AI Ultra 订阅用户即日起可通过在提示栏中选择“Deep Think”与 Gemini 3 Pro 模型搭配使用。

谷歌官方数据显示,Deep Think 模式在处理复杂数学、科学及逻辑问题时的推理能力实现了显著飞跃。最新援引博文介绍,在被誉为“业内最难 AI 基准测试之一”的 Humanity’s Last Exam 中,该模式取得了 41% 的高分,确立了新的行业标杆。
同时,在 GPQA Diamond 科学知识测试中,其得分高达 93.8%;在包含代码执行的 ARC-AGI-2 严苛测试中,也拿下了 45.1% 的成绩,均展现出业内顶尖(State-of-the-art)的性能水平。

Deep Think 模式之所以能取得如此突破,核心在于运用了先进的并行推理技术(Advanced Parallel Reasoning),让模型能够同时探索多种假设路径以寻找最优解。
值得注意的是,该模型的变体此前已在国际数学奥林匹克竞赛(IMO)和国际大学生程序设计竞赛(ICPC)世界总决赛中达到了“金牌标准”。特别是在 IMO 场景下,模型需在无法访问互联网或工具的情况下,于两个 4.5 小时的考试时段内完成解题并撰写自然语言证明。
谷歌此次公测被视为对竞争对手的有力回击。OpenAI 曾在今年 7 月声称其实验性推理大模型达到了数学奥赛金牌水平,但截至目前该模型仍未向公众开放。
随着谷歌率先将达到 IMO 金牌标准的模型推向大众市场,行业普遍预测,这一举动或将迫使 OpenAI 加快同类产品的发布节奏,大模型领域的“推理能力之战”将进一步升级。
《截胡 OpenAI:谷歌率先公测“奥数金牌级”推理 AI 模型 Gemini 3 Deep Think》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
鸿蒙智行累计销量突破100万台:问界M9独占超四分之一!
快科技12月5日消息,鸿蒙智行官宣,历时43个月,旗下五界车型累计销量超过100万台,创中国新势力品牌最快百万交付达成记录。最新数据显示,鸿蒙智行在11月突破81864台达成交付峰值,品牌月成交... -
哈佛调查:59%美国年轻人认为AI会威胁自身就业前景
快科技12月5日消息,《商业内幕》(Business Insider)报道,哈佛大学青年民调(Harvard Youth Poll)最新发布的一项调查显示,大量美国年轻人对人工智能(AI)可能影响自身未来表示担忧。在1... -
近百年悬案告破!中科大单原子实验终结爱因斯坦与玻尔世纪之争
快科技12月5日消息,中国科学技术大学宣布,该校研究团队首次实现了1927年爱因斯坦和玻尔争论中提出的“反冲狭缝”量子干涉思想实验。这次实验观测到了原子动量可调谐的干涉对比度渐... -
2万公里全球最长单程航线完成首航:“水门仪式”接风洗尘
快科技12月5日消息,昨天凌晨2﹕19,东航“国博号”主题彩绘机执行MU745航班首飞2万公里全球最长航线。中国东方航空刚刚宣布,当地时间12月4日16:44(北京时间12月5日3:44),东航M... -
AI颠覆朋友圈
TheVerge的编辑想研究一下AI生图进化到哪一步了,她试用谷歌的Nano Banana Pro工具后惊讶地发现,由AI生成的图像逼真得难以置信,这下她知道这个工具为什么叫“Banana”了(俚语有疯癫...
















