李飞飞引爆的3D新技术,为什么这家深圳公司两年前就“玩腻”了?

瞬间引爆了技术圈对3DGS(3D Gaussian Splatting)的新一轮关注。

也正是因为这个,让大家联想到2005年,那一年MP4格式的出现,视频第一次可以被轻松压缩、分享和播放。

但实际上,在真正熟悉3D高斯泼溅技术的圈子里,“大规模3D高斯模型在移动端打开” 的技术早已不是什么新鲜事。

前面提到的李飞飞的路径更偏向于前者,结合自然语言模型和三维空间生成,是现在我们熟悉的AI生图/AI生视频的升维版本。

虽然也支持照片生模型,但效果对比专业的Reality Capture路径,其生成的模型在精度/结构和完整性上有较大差距,就不归为一类而谈了。

Reality Capture往往使用摄影重建或激光+视觉结合的方式,完整而真实地还原现实世界。

其域创新XGRIDS的LCC(Lixel CyberColor),全球首个可商用的大场景3D高斯产品。

是的,他们在2024年,就推出了这样一套由SLAM空间扫描硬件和3D高斯生成软件组成的现实捕捉方案。

这套方案,可以将真实世界还原成高精度的3D高斯泼溅模型,并且可以在移动端加载无限大的3D高斯模型,这是行业里第一次有人把这件事做成产品。

但在我们的交互介质大多还是二维屏幕的现状下,光是“打开”一个三维模型,似乎没有比看一段视频给用户带来的价值增量有显著区别。

甚至会有很多用户询问“其域发表的‘模型漫游’是不是一段拍摄视频”,甚至感叹“可能还不如一段实拍的4K视频清晰”。

如果只能“粗略地看”,3DGS只是一个看起来更牛的技术,但却不直接解决用户的痛点,很难真正改变用户的交互方式。

无独有偶,另一个做手机重建三维模型的产品Kiri engine的创始人Jack,也曾在一次线下分享中提到,3D技术的行业从业者最经常被询问的问题是——

Jack的回答是:“我们一般只能是去描绘一些有关Vision Pro的未来愿景,或去幻想一下未来10年的工作发展。”

有用户前不久发布了他使用3D高斯技术复刻其所在城市的道路,并使用Vibe coding做了一个赛车游戏,而这一切仅花费了2天时间。

三维博主扎克力,用3D高斯复刻了整个云南国家级保护村落,并使用UE做成移动端可玩的游戏体验。

大热的美剧《Fire Country》(烈焰国度)的幕后,揭露了他们使用3D高斯泼溅技术扫描了一条街道,并在摄影棚中使用3D高斯模型在屏幕上完成了虚拟拍摄,完成了本不可能进行的“实景拍摄任务”。

包括山东文旅在内,他们也使用了3D高斯泼溅技术完成了济南著名景点趵突泉的数字孪生,让游客未来可以线上“云游”趵突泉。

他们通过3D高斯泼溅模型,成功为英伟达和迪士尼机器人完成了具身智能大脑的模拟仿真训练。

数字孪生企业图扑,也放出了使用3D高斯泼溅模型为底图搭建的工厂数字孪生系统,过去这种底图通常是建模师照着现场CAD图纸和照片手工“搓出来”的。

这种转变背后,是因为行业开始意识到:比起“能在手机上跑”,更重要的是有一套能让3D数据真正进入工作流的基础设施。

其域创新的创始人兼CEO赵开勇博士,是北京理工大学空天学院2001级飞行器设计与工程专业出身。

其域创新的LCC方案,以及最新升级的LCC2,本质上就是建立了一整套围绕3DGS的数据基础设施。

LCC支持城市级、园区级的3D高斯数据组织与流式LOD加载。这是让3DGS可以在移动端跑起来的根本,LCC2提升为双轨LOD,让移动端可以秒级打开一个数亿高斯点的数据。

仅为传统PLY格式的8%大小,这不仅提升了加载速度,对于使用者来说也大大节省流量、降低成本。

LCC2将解码与存储分离,独立模块管理,在不同的场景应用中,可以接入最合适的编解码格式,大大便于数据流通。

在LCC解决方案中,其域提供的独特优势是结合其空间扫描硬件的,提供结构化数据的能力——

从发布至今,其域逐步为LCC生态搭建了UE、Unity的plugin(接口),让LCC数据可以无感进入游戏/影视等行业的应用工具链。

其域与英伟达Issac Sim的合作,也完整打通了机器人仿真训练的工作流,甚至是跟英伟达联合的具身智能训练系统。

在其域目前公开展示的应用生态中,全球几乎所有3D高斯应用生态的头部企业都接入了LCC,成为其域生态的一部分。

LCC在做一件事:把3DGS嵌入已有生产体系,而不是成为一个孤岛工具,3D高斯开始进入真实工作流。

当3D内容可以像视频一样被编辑、分发、嵌入工作流、参与生产时,那一刻,才是属于3D世界真正的“MP4时刻”。

量子位 QbitAI 版权所有©北京极客伙伴科技有限公司 京ICP备17005886号-1