当前,以 Agent 为核心的新一轮技术浪潮正在席卷产业。那么,世界模型的下一个突破在哪?Agent 从 Demo 到工程化还差什么?研发体系不重构,还能撑多久?
6 月 26 日-6 月 27 日,AICon全球人工智能开发与应用大会将在上海举办。本次大会将围绕以上问题,邀请来自腾讯、阿里、快手、华为、飞猪等 50+头部企业的技术负责人、高校与科研机构的一线专家,分享 Agent 在真实生产环境中的落地经验与前瞻思考。深入探讨 Agent 从原型到量产的工程挑战、数据与记忆的基础设施底座、安全可信的落地保障,以及大模型推理优化、智算架构升级等关键命题。
火山引擎数智平台端侧记忆负责人马进已确认出席 “AI 原生数据工程” 专题,并发表题为《Lance 实践:从多模态数据湖到 Agent 记忆湖的演进之路》的主题分享。本次分享结合实际建设过程中遇到的数据同步、检索性能、数据演进和系统复杂度问题,讨论 Lance 为什么正在从多模态数据湖方案逐步发展为 Agent Infra 的关键基础设施。该方案已在多模态数据管理和智能检索场景中完成验证,能够有效降低跨系统同步成本,提升数据复用、检索迭代和长期记忆构建效率。
马进,目前任职于火山引擎,长期从事基础软件、数据库和 AI 数据基础设施相关工作,是 Lance 社区核心贡献者及 Maintainer,同时也是 Apache Amoro 项目的 PPMC 成员。曾参与数据库内核、数据平台及第三方平台类产品的设计与研发,在存储引擎、索引、查询优化、数据湖架构、数据治理和平台工程等方向有较多实践经验。目前主要聚焦数据库与 AI Infra 领域,重点关注多模态数据管理、向量检索、Lakehouse 架构以及 Agent 记忆基础设施等技术方向。个人擅长从数据库和数据系统底层视角分析 AI 应用对数据底座的新需求,并结合开源社区与工程实践推动相关技术落地。他在本次会议的详细演讲内容如下:
演讲提纲:
从数据湖到记忆湖:AI 原生数据基础设施的演进
传统数据湖的局限性:结构化数据与离线分析的困局
AI 场景的多模态数据挑战:形态多样、分散存储、链路割裂
从 RAG 到 Agent:数据基础设施的新诉求
Lance:面向多模态 AI 的开放 Lakehouse 格式
核心能力:高效随机访问、原生向量检索、全文检索
Schema 演进与数据版本管理
统一存储层:原始数据、元数据、Embedding、索引一体化
多模态数据湖的统一组织与管理
多模态数据的采集、处理、统一存储
Embedding 与索引管理
数据版本回溯与演进
面向 Agent Memory 的记忆湖构建
长期记忆存储与检索
Agent 场景下的数据底座设计
落地实践中的挑战与解法
数据同步与检索性能优化
数据演进与系统复杂度控制
跨系统同步成本降低与检索迭代效率提升
总结与未来展望
听众收益:
深入了解 AI 原生多模态数据湖的设计理念,掌握从传统数据湖到“记忆湖”的演进路径
学会基于 Lance/LanceDB 构建面向 AI 应用的数据底座,打通“多模态数据统一组织 → Embedding 与索引管理 → Agent Memory 存储”全链路
获取数据同步、检索性能、版本演进等落地实践中的关键挑战与解法,降低系统复杂度、提升迭代效率
除此之外,本次大会还策划了端侧 AI、物理与数字空间智能化、世界模型与多模态智能突破、Agent 架构与工程化实践、Agent 安全与可信治理、企业级研发体系重构、AI 原生数据工程、AI 时代的个人提效与组织变革等 14 个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在现场带来前沿技术洞察和一线实践经验。
更多详情可扫码或联系票务经理 13269078023 进行咨询。