陆陆续续花了上万 RMB ,攒了点心得,也攒了一堆困惑。
1 、MAX 和 HIGH 之间的边界,一直摸不太清。
不知道什么场景下用 HIGH 就够了。让它帮我调个版式,HIGH 确实 OK ,但聊着聊着就会延伸到架构、流程优化——那这时候我是不是得立马切 MAX ?大家遇到这种"任务中途升级"的情况,是怎么处理的?
2 、MAX 也并不是万能的。
大大小小的问题照样会出,尤其是面对复杂工程,或者它对别人写的引擎理解不到位的时候,反复出错,找不到根因,而且确实绕不过一些弯子,也找不到那些非常有"灵感"、比较 Hack 向的手法。
3 、可能之前对"Agent 全自动化流程"有个误解。
后来才意识到:Agent 参与的全自动化流程,本质上约等于人工参与的流程,它一样会犯错,一样需要兜底。所以我认为 Agent 更应该帮我沉淀出连 Agent 都不必介入的稳定 flow 。
4 、上下文( context )的重要性,远比我想象的更关键。
钱花到一定程度才愈发觉得 context 很混乱(我总是让 OPUS 自动帮我考虑 context 该如何优化)。尤其是 4.6 切到 4.7 这段时间,把之前的错误全部纠正了一遍,才意识到——也许我多花了 50% 的经费?
5 、多设备 / 多 Agent / 多 Session 协作方案,大家是怎么搭的?
我目前的配置是:Air 作为移动工作平台,办公室里 2 台 PC + 1 台 Mac mini ,4 台机器协同作业。想听听大家的架构和经验,有没有什么值得借鉴的玩法?
顺便,OPUS 真的太贵了,想转战性价比了,因为 context 、skill 都铺了个大概,现在也对 OPUS 顶配祛魅了。大家给点推荐!
模型像员工,我真不一定要溢价用最高级的。好的流程和规范,还是能让具备基本水平的 Agent 做出有价值的项目;而真正需要突破性能力的环节,当下所谓"顶配"模型其实也不见得比次一档高出多少。
(可能略显愚笨,望轻喷)