Lance 实践：从多模态数据湖到 Agent 记忆湖的演进之路｜AICon上海

当前，以 Agent 为核心的新一轮技术浪潮正在席卷产业。那么，世界模型的下一个突破在哪？Agent 从 Demo 到工程化还差什么？研发体系不重构，还能撑多久？

6 月 26 日-6 月 27 日，AICon全球人工智能开发与应用大会将在上海举办。本次大会将围绕以上问题，邀请来自腾讯、阿里、快手、华为、飞猪等 50+头部企业的技术负责人、高校与科研机构的一线专家，分享 Agent 在真实生产环境中的落地经验与前瞻思考。深入探讨 Agent 从原型到量产的工程挑战、数据与记忆的基础设施底座、安全可信的落地保障，以及大模型推理优化、智算架构升级等关键命题。

火山引擎数智平台端侧记忆负责人马进已确认出席 “AI 原生数据工程” 专题，并发表题为《Lance 实践：从多模态数据湖到 Agent 记忆湖的演进之路》的主题分享。本次分享结合实际建设过程中遇到的数据同步、检索性能、数据演进和系统复杂度问题，讨论 Lance 为什么正在从多模态数据湖方案逐步发展为 Agent Infra 的关键基础设施。该方案已在多模态数据管理和智能检索场景中完成验证，能够有效降低跨系统同步成本，提升数据复用、检索迭代和长期记忆构建效率。

马进，目前任职于火山引擎，长期从事基础软件、数据库和 AI 数据基础设施相关工作，是 Lance 社区核心贡献者及 Maintainer，同时也是 Apache Amoro 项目的 PPMC 成员。曾参与数据库内核、数据平台及第三方平台类产品的设计与研发，在存储引擎、索引、查询优化、数据湖架构、数据治理和平台工程等方向有较多实践经验。目前主要聚焦数据库与 AI Infra 领域，重点关注多模态数据管理、向量检索、Lakehouse 架构以及 Agent 记忆基础设施等技术方向。个人擅长从数据库和数据系统底层视角分析 AI 应用对数据底座的新需求，并结合开源社区与工程实践推动相关技术落地。他在本次会议的详细演讲内容如下：

演讲提纲：
从数据湖到记忆湖：AI 原生数据基础设施的演进
传统数据湖的局限性：结构化数据与离线分析的困局
AI 场景的多模态数据挑战：形态多样、分散存储、链路割裂
从 RAG 到 Agent：数据基础设施的新诉求
Lance：面向多模态 AI 的开放 Lakehouse 格式
核心能力：高效随机访问、原生向量检索、全文检索
Schema 演进与数据版本管理
统一存储层：原始数据、元数据、Embedding、索引一体化
多模态数据湖的统一组织与管理
多模态数据的采集、处理、统一存储
Embedding 与索引管理
数据版本回溯与演进
面向 Agent Memory 的记忆湖构建
长期记忆存储与检索
Agent 场景下的数据底座设计
落地实践中的挑战与解法
数据同步与检索性能优化
数据演进与系统复杂度控制
跨系统同步成本降低与检索迭代效率提升
总结与未来展望
听众收益：
深入了解 AI 原生多模态数据湖的设计理念，掌握从传统数据湖到“记忆湖”的演进路径
学会基于 Lance/LanceDB 构建面向 AI 应用的数据底座，打通“多模态数据统一组织 → Embedding 与索引管理 → Agent Memory 存储”全链路
获取数据同步、检索性能、版本演进等落地实践中的关键挑战与解法，降低系统复杂度、提升迭代效率

除此之外，本次大会还策划了端侧 AI、物理与数字空间智能化、世界模型与多模态智能突破、Agent 架构与工程化实践、Agent 安全与可信治理、企业级研发体系重构、AI 原生数据工程、AI 时代的个人提效与组织变革等 14 个专题论坛，届时将有来自不同行业、不同领域、不同企业的 50+资深专家在现场带来前沿技术洞察和一线实践经验。

更多详情可扫码或联系票务经理 13269078023 进行咨询。

Lance 实践：从多模态数据湖到 Agent 记忆湖的演进之路｜AICon上海