4D基座世界模型的 Scaling Law 呈线性可预测提升。 作者丨齐铖湧
编辑丨马晓宁
据AI科技评论独家获悉,魔芯科技近日正式完成新一轮近亿元融资。本轮由富瀚微股份、联融志道(联想控股旗下基金)、浙创投联合投资,老股东跟投。叠加一个月前华为哈勃领投的Pre-A+轮,魔芯科技在近两个月内已连续拿到两轮近亿元融资。
魔芯科技的投资方目前包括,华为哈勃(算力底座)、富瀚微(核心视觉芯片)、联想控股(智能终端+产业支持)、浙创投(国资产业资本),是一个产业链关键节点+场景落地+产业生态+国资背书的完整逻辑链条。其创始人陈天润为00后浙大在读博士生,师从中国工程院院士、原浙江大学校长潘云鹤。(可参考《做了5年3D打印机,我发现了世界模型的Scaling Law | 00 后创业者系列》一文)
2025 年 11 月,魔芯科技参与研究揭示了其 4D 世界模型空间智能模型能突破现有 VLA(具身视觉 - 语言 - 动作模型)的能力上限的研究论文,已被 CVPR2026 接收。2025 年 12 月,公司在华为(杭州)培训中心发布了交互式视频世界模型「KOKONI-World」原型,用户可以在虚拟空间进行数分钟级、全高清 (1080p) 的实时交互,在多项关键指标上达到行业领先水平。
目前世界模型的主流路线可大致分为,以李飞飞所创立的World Labs为代表的一类"3D原生"路线,用高斯点云+扩散模型构建持久3D环境;Google Genie 3选择自回归Transformer架构,将世界模拟转化为序列预测问题,拥有110亿参数;杨立昆的AMI Labs坚持JEPA(联合嵌入预测架构),认为只有让AI具备物理常识和预测能力,才能真正通向AGI。
魔芯科技采用的是纯隐式空间表示,可以让AI在"脑海中"直接构建一个完整的空间认知模型,不需要中间表示,直接从数据中学习空间的几何结构和物理规律。(雷峰网)
这套路径的优势在于找到了空间智能的“Scaling维度”:,当训练数据在"视角覆盖、时序跨度、场景多样性"等维度扩展,同时模型容量与算力同步增长时,重建的几何一致性、细节完备度以及对空间关系的理解能力呈现可预测提升。这意味着,魔芯科技的 4D 世界模型和大语言模型一样,存在"大力出奇迹"的可能性。

图:实验结果,随着数据量的增加(左图)和模型尺寸提升(右图),模型精度持续提高(误差降低)

目前,魔芯在三个关键领域取得了系统性突破:动态4D场景前馈式重建(输入视频,直接输出带时间维度的三维场景即 4D 动态空间,无需逐帧优化)、长序列连续空间建模(让AI记住场景的长期状态,而不是"看完就忘")、高分辨率前馈三维重建(单次推理即可生成高精度3D模型)。其4D基座模型已经在VLM(视觉语言模型)问答、VLA(视觉语言动作)操作等领域证明了价值,模型规模超过100亿参数,在重建精度和动态支持上已进入行业第一梯队。(雷峰网)