GLM-5编程能力实测:新的全球第一 能超越Opus 4.6
快科技2月11日消息,今天可以说是国产AI大模型历史性的一天,DeepSeek、智谱及Minimax都发布了新一代大模型,其中智谱的GLM-5声势浩大,其编程能力已经成为世界一流水平。从智谱官网介绍来看,...
快科技2月11日消息,今天可以说是国产AI大模型历史性的一天,DeepSeek、智谱及Minimax都发布了新一代大模型,其中智谱的GLM-5声势浩大,其编程能力已经成为世界一流水平。
从智谱官网介绍来看,GLM-5重点就是提升编程与智能体能力,其参数量达到了7440亿,是上代GLM-4.X的2倍左右,因此性能提升很明显。
至于具体的编程能力,拿到了早期测试的海外AI博主@AICodeKing已经发布了测试结果,详细内容可以参考他的视频评测。
来看下结论,在代理编程上,GLM-5搭配Kilo CLI得分589,位列第一,比前不久发布的最强编程模型Claude Opus的585分还高一点。

非代理编程上,GLM-5位列第三,仅次于Opus 4.6及Gemini 3 Pro,但超越了Opus 4.5,实力依然强悍。

具体该如何评价?AICodeKing的结论如下:

除了在一些小技巧上表现不佳之外,GLM-5总体上很出色,基准第三,代理编程上第一,比Opus 4.6还强,而且跟主流的CLI工具兼容性很好,能够用它构建复杂的应用程序。
预计其价格会高于GLM-4,但跟竞争对手相比,依然是一个经济实惠的选择,实际上上面的表格中也提到了编程任务的花费,Opus 4.6及G3P的成本分别达到了6.39及0.85,但GLM-5只要0.14美元,差距是几倍到几十倍,性价比上GLM-5无疑是要远胜前面的两个的,这也是程序员需要考虑的。
当然,对国内的开发者来说GLM-5这种国产AI编程大模型更合适,御三家对国内开发者的客观及主观限制可以说人神共愤。

《GLM-5编程能力实测:新的全球第一 能超越Opus 4.6》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
DeepSeek突发更新:不是V4但惊喜很多 编程实测来了
快科技2月11日消息,这个春节全网都在等DeepSeek发布最新的大模型DeepSeek V4,但是现在来看大版本不一定会在春节期间发布,今天DeepSeek悄然更新了新版本,亮点不少。根据DeepSeek自己的介绍... -
抖音重新上架语音评论引热议 网友:不能转文字 懒得打开听
快科技2月11日消息,据媒体报道,近日,抖音重新上架了语音评论功能,引发网友热议。实测显示,抖音视频评论区可语音留言,也能播放其他用户的语音评论,不过暂不支持转文字。据悉,2023年抖... -
国产AI大模型杀疯了:不止DS 智谱GLM-5、Minimax 2.5双双发布
快科技2月11日消息,大家都知道这个春节档国产AI大模型会集中发布,然而没想到的是在DeepSeek发布新模型之后,其他两个重磅产品——GLM-5、Minimax 2.5也突然上线了。我们之前就介绍... -
GLM-5编程能力实测:新的全球第一 能超越Opus 4.6
快科技2月11日消息,今天可以说是国产AI大模型历史性的一天,DeepSeek、智谱及Minimax都发布了新一代大模型,其中智谱的GLM-5声势浩大,其编程能力已经成为世界一流水平。从智谱官网介绍来看,... -
最近大火的Seedance 2.0能在豆包玩了!国内用户免费用
快科技2月11日消息,字节跳动旗下重磅AI视频生成模型Seedance 2.0正式登陆豆包App,开启灰度测试。国内被纳入测试的用户可免费体验这一爆款模型,无需额外付费,让普通人也能轻松玩转AI视频创...

















