算力新基建,推荐新智能:快手推荐系统池化的探索与实践|AICon上海

当前,以 Agent 为核心的新一轮技术浪潮正在席卷产业。那么,世界模型的下一个突破在哪?Agent 从 Demo 到工程化还差什么?研发体系不重构,还能撑多久?

6 月 26 日-6 月 27 日,AICon全球人工智能开发与应用大会将在上海举办。本次大会将围绕以上问题,邀请来自腾讯、阿里、快手、华为、飞猪等 50+头部企业的技术负责人、高校与科研机构的一线专家,分享 Agent 在真实生产环境中的落地经验与前瞻思考。深入探讨 Agent 从原型到量产的工程挑战、数据与记忆的基础设施底座、安全可信的落地保障,以及大模型推理优化、智算架构升级等关键命题。

快手计算引擎架构组负责人柳嘉强已确认出席 “企业智算架构弹性适配” 专题,并发表题为《算力新基建,推荐新智能:快手推荐系统池化的探索与实践》的主题分享。随着深度学习推荐模型(DLRM)的广泛应用,推荐系统的算力重心正从以 CPU 为主全面转向以 GPU 为主。与此同时,生成式推荐的兴起进一步放大了算力需求,而异构硬件之间增速不均衡的矛盾也愈发突出。传统的资源供给模式已难以兼顾弹性、效率与稳定性,推动推荐系统底层基础设施走向算力池化成为必然选择。本次演讲将系统阐述快手在推荐系统算力池化方向上的思考与实践。

柳嘉强,2008-2017 年在清华大学电子系就读并获得博士学位。毕业后加入百度昆仑芯团队,作为技术骨干参与了人工智能芯片的研发与落地。于 2020 年加入快手算法引擎部,现担任计算引擎架构组负责人,主导了快手预估引擎的重要技术升级,支撑了快手从 SIM 系列到 OneRec 系列的模型优化与上线。他在本次会议的详细演讲内容如下:

演讲提纲:

  1. 为什么要做池化?

  • 随着 DLRM 的应用,推荐系统资源从以 CPU 为主转向以 GPU 为主

  • 生成式推荐对算力的需求持续增加

  • 异构算力增速不均衡现象持续扩大

2. 池化面临的挑战

  • 服务分散化与网络传输开销之间的矛盾

  • 资源灵活扩展和物理资源之间不可避免耦合的矛盾

  • 资源高效利用与资源隔离及服务稳定性要求之间的矛盾

3. 快手池化的实践

  • 面向推荐系统的高性能 RDMA 互联协议

  • 多维度极致 CPU 卸载

  • 统一智能调度框架

4. 总结与展望

听众收益:

  • 了解推荐系统基建的发展历史和我们认为的演进方向

  • 学习快手在池化过程中的技术经验

除此之外,本次大会还策划了端侧 AI、物理与数字空间智能化、世界模型与多模态智能突破、Agent 架构与工程化实践、Agent 安全与可信治理、企业级研发体系重构、AI 原生数据工程、AI 时代的个人提效与组织变革等 14 个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在现场带来前沿技术洞察和一线实践经验。

更多详情可扫码或联系票务经理 13269078023 进行咨询。

算力新基建,推荐新智能:快手推荐系统池化的探索与实践|AICon上海