算力新基建，推荐新智能：快手推荐系统池化的探索与实践｜AICon上海

当前，以 Agent 为核心的新一轮技术浪潮正在席卷产业。那么，世界模型的下一个突破在哪？Agent 从 Demo 到工程化还差什么？研发体系不重构，还能撑多久？

6 月 26 日-6 月 27 日，AICon全球人工智能开发与应用大会将在上海举办。本次大会将围绕以上问题，邀请来自腾讯、阿里、快手、华为、飞猪等 50+头部企业的技术负责人、高校与科研机构的一线专家，分享 Agent 在真实生产环境中的落地经验与前瞻思考。深入探讨 Agent 从原型到量产的工程挑战、数据与记忆的基础设施底座、安全可信的落地保障，以及大模型推理优化、智算架构升级等关键命题。

快手计算引擎架构组负责人柳嘉强已确认出席 “企业智算架构弹性适配” 专题，并发表题为《算力新基建，推荐新智能：快手推荐系统池化的探索与实践》的主题分享。随着深度学习推荐模型（DLRM）的广泛应用，推荐系统的算力重心正从以 CPU 为主全面转向以 GPU 为主。与此同时，生成式推荐的兴起进一步放大了算力需求，而异构硬件之间增速不均衡的矛盾也愈发突出。传统的资源供给模式已难以兼顾弹性、效率与稳定性，推动推荐系统底层基础设施走向算力池化成为必然选择。本次演讲将系统阐述快手在推荐系统算力池化方向上的思考与实践。

柳嘉强，2008-2017 年在清华大学电子系就读并获得博士学位。毕业后加入百度昆仑芯团队，作为技术骨干参与了人工智能芯片的研发与落地。于 2020 年加入快手算法引擎部，现担任计算引擎架构组负责人，主导了快手预估引擎的重要技术升级，支撑了快手从 SIM 系列到 OneRec 系列的模型优化与上线。他在本次会议的详细演讲内容如下：

演讲提纲：
为什么要做池化？
随着 DLRM 的应用，推荐系统资源从以 CPU 为主转向以 GPU 为主
生成式推荐对算力的需求持续增加
异构算力增速不均衡现象持续扩大
2. 池化面临的挑战
服务分散化与网络传输开销之间的矛盾
资源灵活扩展和物理资源之间不可避免耦合的矛盾
资源高效利用与资源隔离及服务稳定性要求之间的矛盾
3. 快手池化的实践
面向推荐系统的高性能 RDMA 互联协议
多维度极致 CPU 卸载
统一智能调度框架
4. 总结与展望
听众收益：
了解推荐系统基建的发展历史和我们认为的演进方向
学习快手在池化过程中的技术经验

除此之外，本次大会还策划了端侧 AI、物理与数字空间智能化、世界模型与多模态智能突破、Agent 架构与工程化实践、Agent 安全与可信治理、企业级研发体系重构、AI 原生数据工程、AI 时代的个人提效与组织变革等 14 个专题论坛，届时将有来自不同行业、不同领域、不同企业的 50+资深专家在现场带来前沿技术洞察和一线实践经验。

更多详情可扫码或联系票务经理 13269078023 进行咨询。