3个月手搓Gamma架构,这个团队打造出了场景白盒化推理的“下一代内容OS”

网友A:OpenClaw搁哪儿用啊? 网友B:不是,谁还用Claw啊,现在我们都用Hermes了好吧!!!

过去一年,AI行业的焦点从单纯的基座模型开发,转向了以Hermes、Claude Code、Harness等以智能体和工程化系统为核心的新阶段。

行业热议的背后,一个不得不承认的事实是:AI应用,开始从生成范式转向任务执行范式。

用户真正需要的,已经不只是一个会回答问题的聊天框,而是一个能让AI生产过程可见可控、能解决上下文困境,并允许人随时介入的白盒化系统。

但最值得玩味的是,在这波系统化浪潮真正爆发之前,已经有一个团队早早就押中了这个命题,并率先下场交出了答案——

通过AI驱动的可编辑内容系统「Pi」(Presentation Intelligence),这个团队把AI的生成能力和人的编辑能力,真正装进了同一个系统,让内容设计真正实现白盒化。

AI不再只是吐出一份设计结果,而是能够自动搭建结构并生成设计,并在持续创作中沉淀和调用上下文记忆。

人也不再只能围着结果反复抽卡,而是可以像编辑文档一样,对内容进行修改和持续接管,真正打破创作瓶颈问题。

过去很长一段时间,AI内容创作真正的瓶颈,并不在于模型能力不够强,而在于用户真的很难真正参与到内容「编辑」这件事情中去。

想改结构,得重新写prompt;想调整某一页的局部细节,也很难像使用传统编辑器那样直接上手操作。

用户消耗了更多时间,也烧掉了更多Tokens,但最后得到的结果,未必真正更接近自己想要的那个版本。(扎心了)

AI提供内容侧的Agent能力,负责生成、补全、调整和优化;但用户也可以在任意环节介入,对设计内容手动修改~

无处不在到什么程度呢——在Agent吐出大纲的那一刻,大家就已经可以直接上手搓搓搓了。(doge)

比如我丢进去一份带有表格的工作总结报告,当Agent帮我自动生成框架后,我可以直接在它基础上进文字编辑。

当然,在过去的AI内容创作中,除了编辑受限外,还有一个困扰无数创作者的大大大bug——

创作者经常要在多个AI工具之间来回切换:先用聊天工具写文案,再导入设计软件做排版,最后还要借助工作流工具管理进度和版本,整个工具链可以说是非常之割裂。

针对这个困境Pi给出的解法是,搭建一个持续运行的内容环境,让创作全流程实现真正的「系统内闭环」。

基于多模态大模型能力,Pi能理解用户内容与创作意图,实现大纲梳理、结构搭建,到布局设计、样式配置、配图生成、文字处理,多格式导出的创作全流程。

在具体的页面能力上,Pi并没有只提供单一入口,而是给出了Agent、一键生成、AI助手等多种模式,满足不同用户的差异化设计需求。

对于手里已经有现成资料的友友来说,可以直接使用一键生成能力快速生成大纲,把原本零散的文档整理成一套清晰的框架内容。

但对于不少有着设计创作需求的用户而言,他们不见得手里有一份现成的文档,而是需要AI提供一个内容思路。

这时候就可以进入Agent模式,让Agent帮忙梳理逻辑搜集资料然后再生成PPT,实现从想法建立到创作落地的闭环。

但Pi的系统化能力,也远不止停留在内容创作,更体现在内容的可迭代、可进化,以及面向不同场景的适配能力。

改着改着,就开始不断「另存为」,最后电脑桌面上莫名其妙多出一堆以(1)(2)(3)结尾的版本,真想找回某个早期版本时,反而难如登天……

而在Pi中,几乎不存在版本找不到的问题,因为用户可以直接在历史记录里找回过往版本,并在此基础上继续进行多轮优化。

这样一来,设计本身就不再是一次性交付的文件,而是可以持续生长、持续迭代的创作资产。

支持PDF、PNG、PPT等多种格式导出,支持团队协作,并且能够动态适应不同篇幅、空间、设备、格式和媒介下的展示需求。

在这个过程中,内容不再只是一次性的生成结果,而是可以持续管理、持续更新、持续分发的「生产资料」。

当然,AI内容创作难,难在可控性和多种工具调用上,更难在「上下文复杂性」和「模型记忆缺失」的问题。

目前很多AI工具在记忆层面仍然薄弱,上下文窗口看似越来越长,但长期记忆、偏好继承、项目知识沉淀和跨任务调用能力依然不够稳定。

而Pi给出的解法是——通过「记忆系统」,让用户偏好能够被沉淀,让上下文可以被继承,进而让人和AI的协同效率持续提升。

例如,当用户在编辑页面的任意位置唤起AI时,系统能够结合历史上下文、项目内容和用户习惯,自动生成更贴合当前场景的内容:

不仅如此,在AI图片编辑中,Pi也能基于此前的人机对话内容、当前页面语境,以及对整份内容的理解,自动生成更符合当前内容模块需求的prompt:

在内容创作过程中,创作者真正消耗精力的地方,往往不只是生成内容本身,还有一次次向AI解释背景、重申风格、校准方向的过程。

只有上下文能够被继承、偏好能够被记住、创作过程能够连续推进,AI才真正从单次生成工具,进入长期内容项目的生产链路。

而记忆系统的价值,就在于AI不再需要每一次都「从零」理解用户,原本容易流失的创作信息都能够沉淀下来。

当内容创作变得更可控、更系统,当上下文能力贯穿创作始终,整个内容生产流程才真正走向白盒化。

真正支撑这一切的,是Pi在底层搭起的一套Runtime Agent-OS,一个涵盖实体层、交互层和记忆层的智能体操作系统。

第一层是「实体层」,也是Pi的资源管理层,其作用是让所有创作资源都变成可调用对象。

这里的资源既包括文件、数据、工具,也包括模型、策略和运行环境,它们不再只是孤立素材,而是可以被Agent调度、被用户编辑、被系统持续复用的内容资产。

这也是实体层的核心价值——让内容创作从到处找资源、临时拼流程,变成资源可管理、能力可调用。

随着可调用实体不断积累,Pi也能形成更高密度的资源网络,Agent调用得越多,内容资产沉淀得越多,系统对创作流程的理解和组织能力也会越强。

而第二层「交互层」,其核心价值则是实现内容创作白盒化推理,让创作流程从「抽卡」变成「编排」。

数据怎么拉取、图表怎么生成、内容怎么组织、版式怎么调整,都能被纳入可追踪、可解释、可干预的流程中。

在这套机制下,设计产出过程能够被拆解为更细颗粒度的步骤,并通过精益推理和多样化编排持续推进,让整个内容产出过程可追溯、可解释、可干预。

最后一层是「记忆层」,其价值在于让Agent懂得用户习惯偏好,并且带着记忆和经验干活。

具体来看,记忆层覆盖技能、知识、偏好、压缩、管理、治理六个维度,这套机制本质上是减少创作过程中的「信息磨损」的问题——

让多轮对话不容易跑偏,复杂修改不必反复解释,几十页报告、多轮迭代等高强度任务也能保持上下文连续。

在此基础上,Pi能够实现大规模上下文沉淀和高效调用,支撑生产级高吞吐场景,让智能体稳定处理更复杂、更长链路的内容设计需求。

当这三层能力串联起来,Pi才真正具备将内容对象、用户操作和上下文记忆真正组织到同一套系统里的能力。

让每一步生成、修改、调用和迭代都有迹可循,让创作者重新看见过程、理解过程,并真正掌控过程,进而真正实现白盒化的内容生产创作闭环。

从早期DOS、CLI里的指令输入,到菜单式界面的层层操作,再到GUI时代的点击、拖拽、编辑和排版,交互方式一直在变得更可编辑和可操作。

如今,自然语言交互进一步降低了门槛,用户只要一句话,就能让AI生成文案、PPT、网页、图片甚至视频。

在Pi团队看来,GUI也好,自然语言也好,本质上都是不同阶段的交互方式,真正需要被重新定义的,是AI、人与内容之间的协作关系。

换句话说,Agent能力和人的编辑掌控力,二者并不冲突,甚至可以在同一个系统中并存流动——

需要理思路、搭框架、出初稿时,交给Agent;需要局部修改、细节打磨时,人再亲自上手接管。

这样一来,内容生产也从单次生成,走向一种更可控、更持续的协作过程,真正实现1+1大于2的效果。

目前,Pi全球用户规模已将近500万量级,并先后入围2025年中国年度杰出人工智能产品、2026年十大最佳AI演示生成器等榜单。

今年,Pi进一步跻身英伟达殿堂大中华区最终十席,开始出现在更国际化的AI创业与技术生态视野中。

那就是AI内容创作正在进入新的分水岭,单次生成的「速度与效果」,正在让位于更长期的「系统能力」。

Pi团队下一步要做的,就是让Agent能力更加参数化、系统化,进一步缩短创作编排流程,把AI从单次生成工具,继续推向更可控、更连续、更可复用的内容生产系统。

未来的AIGC产品的迭代与行业竞争,比的是谁能把AI能力真正嵌进创作流程,谁能让创作者在AI时代继续保有判断、控制和表达。

量子位 QbitAI 版权所有©北京极客伙伴科技有限公司 京ICP备17005886号-1