林俊旸果然创业了！一个“Qwen负责人”头衔值135亿

对于一家还没发产品的中国AI初创公司而言，这一估值，几乎没有先例。但相比林俊旸之前同台竞速的硅谷同行，不算贵。

具体公司还不知道名字，但据说种子轮目标估值已经高达20亿美元（约135亿元人民币）。

根据The Information消息，高榕资本与红杉中国被曝就投资事宜与该实验室进行深入洽谈。

对于一家还没发产品的中国AI初创公司而言，这一估值，几乎没有先例。但相比林俊旸之前同台竞速的硅谷同行，不算贵。

林俊旸2019年加入阿里，早期研究方向集中在搜索、推荐场景下的自然语言处理和多模态建模。

此后，他深度参与M6等超大规模预训练模型工作。M6是阿里早期最有代表性的多模态大模型项目之一。

Qwen项目成立后，林俊旸成为技术负责人，带队打造Qwen系列大语言与多模态模型，并主导开源工作。

它有不同尺寸的模型，有面向开发者的开源路线，也有持续更新的多模态、代码和轻量化模型版本。对开发者来说，Qwen是真正能下载、能微调、能部署、能二次开发的实用模型。

林俊旸离职后的首篇长文，标题为《From “Reasoning” Thinking to “Agentic” Thinking》。

思考模型花更多推理算力，强化学习得到更稳定的反馈，数学、代码、逻辑等可验证任务成为核心训练场景。

尤其是在代码和智能体工作流里，真正重要的是代码库导航、计划拆解、错误恢复、工具编排，以及长时间执行任务的质量。

林俊旸把它定义为一种“为了行动而思考”的能力。它不只是让模型在回答前想更久，而是让模型在环境里行动、观察反馈、修正计划，再继续推进。

当反馈信号可靠且基础设施能够支撑时，语言模型之上的RL可以产出质的飞跃式的认知能力。

从想得更久，到为了行动而想。训练的核心对象已经改变了——它变成了模型+环境的系统，或者更具体地说，是智能体和围绕它的编排框架。

模型架构和训练数据当然仍然重要，但环境设计、轨迹采样基础设施、评估器鲁棒性、以及多智能体之间的协调接口同样关键。

在智能体时代，优势将来自更好的环境、更紧密的训练-推理耦合、更强的编排工程，以及在模型的决策与这些决策产生的后果之间实现闭环的能力。

自林俊旸发长文探讨Agentic Thinking后，个人社交媒体账号就没在发声。

参考链接：
[1]
https://x.com/jingyanghk/status/2054450088400093359

量子位 QbitAI