苹果开源 SHARP 模型,1 秒内 AI 让照片变 3D“活”起来
最新 12 月 18 日消息,科技媒体 9to5Mac 昨日(12 月 17 日)发布博文,报道称苹果公司开源名为 SHARP 的新型 AI 模型,该技术能在一秒内将单张 2D 照片转换为逼真的 3D 场景。
最新援引博文介绍,苹果发布名为《一秒内实现清晰的单目视图合成》(Sharp Monocular View Synthesis in Less Than a Second)论文,详细介绍了如何训练模型,在接收用户输入的一张普通 2D 照片后,能在一秒钟内重建出具有真实物理比例的 3D 场景。

与需要数分钟甚至数小时处理的传统方案相比,SHARP 将合成速度提升了三个数量级,实现了近乎实时的 3D 转换体验。
在技术原理上,SHARP 采用了先进的 3D 高斯泼溅技术(3D Gaussian Splatting)。简单来说,它将 3D 场景视为无数个带有颜色和光影信息的“模糊光团”(高斯球)。

传统的 3D 重建通常需要对同一场景拍摄数十甚至上百张不同角度的照片,再通过复杂的计算来确定这些光团的位置。然而,苹果通过使用海量的合成数据与真实世界数据训练 SHARP,让其掌握了通用的深度与几何规律。
因此,当面对一张全新照片时,SHARP 能通过神经网络的单次前馈传递,直接预测出数百万个 3D 高斯球的位置与外观,瞬间完成建模。
除了速度惊人,SHARP 在成像质量上也树立了新标杆。根据苹果公布的论文数据,该模型在多个基准测试数据集上均取得了优异成绩。

与此前业内最强的模型相比,SHARP 将 LPIPS(一种感知图像块相似度度量标准)降低了 25 个百分点至 34%,同时将 DISTS(纹理相似度指标)降低了 21 个百分点至 43%。这意味着,由 SHARP 生成的 3D 视图在细节纹理和整体结构上都更接近真实世界,且具备绝对尺度,支持真实的相机移动模拟。
不过,SHARP 目前仍存在一定的物理限制。为了保证生成的真实性与速度,该模型主要侧重于重建拍摄视角附近的 3D 视图,而不会凭空“脑补”照片中完全被遮挡或未拍摄到的盲区。
因此,用户在浏览生成的 3D 场景时,视角移动范围需保持在原图拍摄位置的邻近区域。苹果目前已将 SHARP 的完整代码及相关资源发布在 GitHub 平台,全球开发者均可下载测试,这一举措预计将大幅加速移动端 3D 内容创作与空间计算应用的发展。
最新附上网友利用该模型,生成的 3D 场景如下:




《苹果开源 SHARP 模型,1 秒内 AI 让照片变 3D“活”起来》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
频繁口腔溃疡 可能是用了含SLS的牙膏!99%的人不知道
快科技12月17日消息,日常生活中,有人总是频繁口腔溃疡,即便没有吃辣上火,而诱发原因可能就是使用了含有SLS的牙膏。SLS中文名月桂醇硫酸酯钠,是一种表面活性剂,能让牙膏在刷牙的过程中产... -
全球首个!情感交互人形机器人“爱湫”将发布:龙蜥外形设计
快科技12月17日消息,四川具身人形机器人宣布,将推出全球首款主打情感交互的人形机器人“爱湫-AIQ”。该机器人外形设计灵感源自西南地区特有保护物种龙蜥,在形态上兼具亲和力与独... -
睡多浪费:张朝阳四小时睡眠法被炮轰 中国科学院院士回应!
快科技12月17日消息,近日张朝阳又一次分享了自己的4小时睡眠法,认为睡多就是浪费,而这个言论被行业专家狠批。中国科学院院士,精神医学与睡眠医学家陆林近日接受采访时表示,很多人认为睡眠... -
我国侵入式脑机接口临床试验新进展!从二维到三维物理世界重大转变
快科技12月17日消息,据央视新闻报道,今日,中国科学院脑科学与智能技术卓越创新中心发布该中心与国内科研机构及医疗单位合作开展的第二例侵入式脑机接口临床试验取得的新进展。本次临床试验... -
求求了!别只知道吃榨菜 它的“真身”更好吃
一到冬天,川渝的这道冬季限定菜就会被端上了饭桌。看到是不是有种似曾相识的感觉?其实,它就是我们常吃的榨菜原身——青菜头。图源:某社交平台即便如今的生活非常便利,一年...

















