当前,以 Agent 为核心的新一轮技术浪潮正在席卷产业。那么,世界模型的下一个突破在哪?Agent 从 Demo 到工程化还差什么?研发体系不重构,还能撑多久?
6 月 26 日-6 月 27 日,AICon全球人工智能开发与应用大会将在上海举办。本次大会将围绕以上问题,邀请来自腾讯、阿里、快手、华为、飞猪等 50+头部企业的技术负责人、高校与科研机构的一线专家,分享 Agent 在真实生产环境中的落地经验与前瞻思考。深入探讨 Agent 从原型到量产的工程挑战、数据与记忆的基础设施底座、安全可信的落地保障,以及大模型推理优化、智算架构升级等关键命题。
快手计算引擎架构组负责人柳嘉强已确认出席 “企业智算架构弹性适配” 专题,并发表题为《算力新基建,推荐新智能:快手推荐系统池化的探索与实践》的主题分享。随着深度学习推荐模型(DLRM)的广泛应用,推荐系统的算力重心正从以 CPU 为主全面转向以 GPU 为主。与此同时,生成式推荐的兴起进一步放大了算力需求,而异构硬件之间增速不均衡的矛盾也愈发突出。传统的资源供给模式已难以兼顾弹性、效率与稳定性,推动推荐系统底层基础设施走向算力池化成为必然选择。本次演讲将系统阐述快手在推荐系统算力池化方向上的思考与实践。
柳嘉强,2008-2017 年在清华大学电子系就读并获得博士学位。毕业后加入百度昆仑芯团队,作为技术骨干参与了人工智能芯片的研发与落地。于 2020 年加入快手算法引擎部,现担任计算引擎架构组负责人,主导了快手预估引擎的重要技术升级,支撑了快手从 SIM 系列到 OneRec 系列的模型优化与上线。他在本次会议的详细演讲内容如下:
演讲提纲:
为什么要做池化?
随着 DLRM 的应用,推荐系统资源从以 CPU 为主转向以 GPU 为主
生成式推荐对算力的需求持续增加
异构算力增速不均衡现象持续扩大
2. 池化面临的挑战
服务分散化与网络传输开销之间的矛盾
资源灵活扩展和物理资源之间不可避免耦合的矛盾
资源高效利用与资源隔离及服务稳定性要求之间的矛盾
3. 快手池化的实践
面向推荐系统的高性能 RDMA 互联协议
多维度极致 CPU 卸载
统一智能调度框架
4. 总结与展望
听众收益:
了解推荐系统基建的发展历史和我们认为的演进方向
学习快手在池化过程中的技术经验
除此之外,本次大会还策划了端侧 AI、物理与数字空间智能化、世界模型与多模态智能突破、Agent 架构与工程化实践、Agent 安全与可信治理、企业级研发体系重构、AI 原生数据工程、AI 时代的个人提效与组织变革等 14 个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在现场带来前沿技术洞察和一线实践经验。
更多详情可扫码或联系票务经理 13269078023 进行咨询。