Qwen和钉钉,无招和俊旸

骆轶航 ☉ 文 来源:硅基立场
2026-03-19 @ 哈希力量文库

文库划重点:据说俊旸带领的Qwen团队有很鲜明的“厌蠢”气质。我理解这不是一种基于智力优越感的碾压,而是基于对非技术第一性出发的需求和命令的本能不耐烦,甚至消极反抗。“技术决定一切”从来不是阿里的基因,达摩院也不是DeepMind。


为什么一开始被宽容和鼓励的,总在最好的时候被打破?xUf哈希力量 | 通用人工智能文库

1,我非常喜欢林俊旸。聪明、直率又有点mean的人我都喜欢。跟他同台和连线直播的几次经历简直不要太愉快:不会滔滔不绝,也不会惜字如金,表达克制、准确、优雅,偶尔毒舌。好几次从panel下来,他第一句话就是:“你提的问题够骚的啊”。这个评价我喜欢。xUf哈希力量 | 通用人工智能文库

2,我觉得林俊旸跟其他AI基础模型的研究人员最不一样的地方,是他的应用语言学学科背景。应用语言学的重要分支是计算语言学。计算机背景的人往往视语言为单纯的序列问题,但语言学训练会让人理解语言远不止于此:句法结构、语义组合性、语用推理、指代消解等,逐一对应着大语言模型“涌现”过程中展现的能力。这也意味着懂语言学的人在设计评估基准、诊断模型缺陷时,能看到纯工程视角看不到的东西。随着大模型从“能用”走向“可靠”和“可控”,语言学的价值将越来越大——它们指向的是语言最复杂的现象。俊旸的学科背景,在Qwen的模型训练和评估过程当中应该是发挥了相关作用的。xUf哈希力量 | 通用人工智能文库

3,如果检索过林俊旸参与的学术论文,也能发现一条非常清晰的学术品味脉络。他的标志性工作之一是OFA,一个与任务和模态无关的统一预训练框架,以及Chinese CLIP(中文跨模态检索和表征生成)。它们的核心思路都是不需要为每个任务或模态搭建专门的脚手架,而是用一个足够通用的框架把所有东西装进去。这其实是非常语言学的思维,即寻找一套符号系统的底层生成语法。xUf哈希力量 | 通用人工智能文库

4,另一方面,俊旸参与发表的几乎没有纯理论探索型的论文,而是每一篇论文都伴随着可用的开源代码和模型。这恰恰是当前学术界和工业界最欢迎的论文格式与论文品位。Qwen系列能够在Hugging Face上积累超过6亿次下载和超过17万个衍生模型,与这种作为default setting的学术贡献方法是密切相关的。xUf哈希力量 | 通用人工智能文库

5,之所以说这么多,我其实想表达的是:作为Qwen在相当一段时间内最重要的核心开发者和贡献者之一,林俊旸的一系列工作,无论是学术贡献、模型发布还是与开源社区的关系建设,都对今天Qwen在全球大语言模型竞技场上的江湖地位,至关重要。他是那个让Qwen在全球AI社区被看到、被关注、被重视的关键先生。我不敢说他是Qwen的“灵魂人物”,但不可或缺。xUf哈希力量 | 通用人工智能文库

6,在俊旸闪电离职,处在舆论的风口浪尖。一些人把他推到了“千问之父”的高度,认为他与Sam Altman、Dario Amodei和Demis Hassabis的地位相当,这是捧杀,也不符合事实。我过去就跟俊旸的同事开玩笑说过俊旸是通义的Jason Wei,他的同事哈哈大笑说yes he is。现在,我觉得,他更像是通义的Andrej Kaparthy。xUf哈希力量 | 通用人工智能文库

7,无论Jason Wei还是Andrej Kaparthy,在OpenAI走入公众视野的关键阶段,角色都是独树一帜且不可替代的:他们在社交媒体和AI社区和人们打成一片,时而卖萌耍宝,更多是倾听用户的反馈,跟开发者和关键用户互动,说人话,拉近了OpenAI与公众与开发者的距离,为OpenAI赢得了口碑和路人缘。你以为这活儿谁都能干?反正这俩人离开之后,OpenAI就没人对外“说人话”了。xUf哈希力量 | 通用人工智能文库

8,俊旸对Qwen的意义也在这儿。除了模型研发,他做的是Qwen作为一个AI团队最有“活人感”的工作。对开源社区来说,这种“活人感”更加重要。开源社区是有英雄情结的,对那些积极贡献成果、认真听取反馈、持续迭代成果的人有着天然本能的好感,视他们为偶像。xUf哈希力量 | 通用人工智能文库

9,更重要的是:与OpenAI和Google不同,阿里巴巴的一众高管,包括阿里云的关键负责人,在全球AI生态是缺席和不可见的。俊旸几乎是外界与Qwen打交道的唯一面孔,是Qwen在全球AI社区几乎唯一鲜活的碳基因子。他不是要喧谁的宾夺谁的主,而是这活儿总得有人干,也不是谁都能干。他在社交平台和开源社区的活跃,让阿里巴巴在全世界的AI存在感,省下了30亿的红包。xUf哈希力量 | 通用人工智能文库

10,从全球AI生态站位的角度,Qwen的功业是有目共睹的,俊旸的存在感也恰如其分。但在中国这个厮杀更残酷的大语言模型版图上,在Qwen的口碑效应,必须与API调用量和阿里云的token消耗量等关键KPI绑定的时候,事情就起了变化。xUf哈希力量 | 通用人工智能文库

11,当Qwen不再是通义实验室的Qwen,而是阿里巴巴的Qwen之后,Qwen的角色就必须由实验室伊甸园里的开源玫瑰,变成巨头冲锋陷阵的基础设施甚至印钞机。没谁能在实验室和战壕里同时活得优雅。OpenAI不行,DeepSeek不需要,Google可能能打破这个魔咒,但还得再看。xUf哈希力量 | 通用人工智能文库

12,而Qwen在硅谷AI生态的震撼效应、在全球社区和开发者群体的极佳口碑,在电商、外卖、打车、公有云和私有云市场厮杀过的阿里特种部队看来,什么都不是。xUf哈希力量 | 通用人工智能文库

13,我知道的情况是:通义万象(Wan)的图像生成模型API,在阿里云上卖得不错。可Qwen的API调用量就是起不来。Qwen的小尺寸模型很受开发者欢迎,但主要靠免费下载,赚的是口碑和品牌,不能体现在实际产生收入的API消耗上,大尺寸模型的商业用户少,收不到钱,阿里云的销售就摘不到桃子。备受中国人民讨厌的Anthropic CEO Dario Amodei说他们企业级商战只看得到OpenAI抢单,看不到Qwen的存在,这话倒也不假。xUf哈希力量 | 通用人工智能文库

14,国内也一样。字节跳动天天讲火山引擎token消耗量全国公有云第一,形成了一套token经济学,豆包的模型能力在火山引擎上卖得风生水起,但Qwen就没给阿里云带来token经济学。Qwen是天然亲近开发者的,甚至愿意为了开发者的呼声彻底改变技术路径——俊旸的团队从Qwen2.5之前的dense Transformer全面转向MoE,就是响应社区的呼声,也成就了Qwen3在开发者社区的极佳口碑。但他们在服务阿里内部“客户”的时候好像就没那么慷慨,磕绊也比较多。xUf哈希力量 | 通用人工智能文库

15,据说俊旸带领的Qwen团队有很鲜明的“厌蠢”气质。我理解这不是一种基于智力优越感的碾压,而是基于对非技术第一性出发的需求和命令的本能不耐烦,甚至消极反抗。“技术决定一切”从来不是阿里的基因,达摩院也不是DeepMind。冲突不难想象,而且很可能的结果是:双方都感觉受到了冒犯。xUf哈希力量 | 通用人工智能文库

16,不过讲真,Qwen团队这种“特立独行”的气质,我是深表理解的。与字节的豆包和Seed模型倍享资源优待不同,Qwen从一开始就没得到过来自阿里的最好的资源。缺卡和算力稀松平常,一直到今天都没解决,这个问题也在林俊旸宣布离职之后的内部All hands meeting上被摆到了桌面。Qwen是在比竞争对手资源少了N倍的情况下,做到了今天这个样子。xUf哈希力量 | 通用人工智能文库

17,记得2024年9月的“云栖大会”。上午主会场,聚光灯给到了阿里的朋友们——月之暗面、阶跃星辰和生数科技,Qwen甚至没有亮相的机会。当时阿里各个部门都在训自己的模型,都在争抢芯片和云的算力资源,很多业务单元摆明了不想用Qwen模型。Qwen号称阿里AI的战略项目,但从资源上真的都看不出来。如果在字节,这是不可想象的。xUf哈希力量 | 通用人工智能文库

18,但也就是在Qwen在云栖大会上备受冷遇的2024年9月,Qwen在Google Trends的曲线开始上扬,12月上扬趋势变得极其陡峭,大概率与当月Qwen开放部分权重相关。Qwen在Google Trends的曲线最高点在2025年2月,借了一把DeepSeek R1开源的势,但此后也一直居高不下,已成开源明星气象。xUf哈希力量 | 通用人工智能文库

19,从Qwen2022年底立项,我就密切关注它的进展。但到了2025年初,我更愿意观察阿里从集团层面会怎么对待Qwen——这个在内部被冷遇到极点时骤然翻盘的大语言模型成果,未来能拿到什么资源,话语权能不能提升。不是有人说“西谷东阿”么,Qwen在阿里内部的话语权,总该跟Gemini在Google有一拼吧。xUf哈希力量 | 通用人工智能文库

20,不出所料,等来了林俊旸的升职,周靖人成为阿里合伙人,也等来了Qwen成为阿里AI的基础设施。但我没料到的是:Qwen很快就被用来点外卖和订机票,配发春节30亿的红包。我觉得这真的很好,但我自己没能说服自己的是:让14亿中国人每人都点上一杯奶茶,跟成为全球4亿家中小企业的AI底座,哪个更重要,更有意义,对中国AI的全球竞争力提升更有助力?xUf哈希力量 | 通用人工智能文库

21,当然我更没料到:Qwen——现在已经“大一统”为千问,战略地位看似提升了,成了公司AI底座,但主线任务变成了支持通义APP,以及电商外卖等传统核心业务,而不再是全球AI开源生态的领导者。我认为这件事迟早得发生,但应该再晚一点。Qwen和Gemini都是第二代逆风翻盘的,但Google也有云业务,更有广告和其它业务,但它也没那么着急啊。xUf哈希力量 | 通用人工智能文库

22,我倒是料到了林俊旸会离职。从去年10月千问大一统开始,我就觉得他呆不住了,他肯定比谁都清楚,桃子要被摘走了。1月在清华大学AGI-Next前沿峰会上,他已经很放飞自我了,不但暗怼了姚顺雨,还话里话外透露阿里给Qwen的资源依然不够,只言片语不提千问APP,只讲qwen.com。我甚至觉得他出席这场活动本身都是率性而为,因为毕竟从2024年9月Qwen在全球起势之后,我就再也没法喊他来参加我的论坛或直播了,不是他不想讲,而是“出不来了”,外部的活动谁都叫不出来。更准确地说,从去年12月他飞到圣地亚哥参加NIPS我就觉得事情起了变化,要知道公司一直是“保护”他,不让他去美国的。xUf哈希力量 | 通用人工智能文库

23,但一条推特就挂印离去,还是我万万没想到的。我知道林同学有性格,但这么有性格真是吓到我了。也许他就是在等着内部跟他摊牌的那一天。他自己肯定知道Qwen对千问APP的支持不够,给阿里云带来的token收入也有限,但他肯定是自己不想再努力了。xUf哈希力量 | 通用人工智能文库

24,俊旸眼下的不愿意妥协的状态,以及Qwen的走向,和阿里巴巴的内在张力,都跟阿里巴巴历史上的一幕惊人的相似:2020年的钉钉,“灵魂人物”无招被调离,旋即在第二年出走。Qwen和钉钉在阿里的体系内,居然拿到了完全一致的上半场脚本。xUf哈希力量 | 通用人工智能文库

25,钉钉一开始也是在内部要不到资源,不被看好的项目。无招是在“来往”失败之后被发配去搞钉钉的,带着团队躲到湖畔花园,靠“CEO特别经费”度日,钉钉一开始推出来连内部都不想用。跟无招相比,俊旸除了出身更“清白”,没有在内部被打上“运气不好”和“loser”的标签之外,其他地方简直不要太像:一开始表面上Qwen是战略级项目,其实真的没什么资源,做出来其它部门也不想用,得先从外部打开空间。xUf哈希力量 | 通用人工智能文库

26,但昨日的钉钉和今日的Qwen,又确实在内部得到了恰到好处又适可而止的保护,让它们至少能维持运营,不至于被其它团队瓦解和拆分。当初“保护”了钉钉的,是马老师和曾担任CEO的陆兆禧;而过去三年一直保护了Qwen独立性的,坦率地说,除了靖人,也有现任CEO吴泳铭。甚至Qwen走开源路线,也不是靖人和俊旸能最终拍板的,还得是吴妈。尽管一度分配到的资源和内部关注度有限,但没有这些底线的支持和定调,Qwen也等不到它被全球AI生态看到的那天。xUf哈希力量 | 通用人工智能文库

27,钉钉跟Qwen“独来独往”的性格很相似,而这也是它们在被底线保护,同时又缺少资源和内部更多支持的情形下自我养成的。钉钉在开拓阿里擅长的电商商家客户受挫后,转向了连IT系统都没有的中国中小型企业,刻意绕开了阿里资源最擅长的领域,居然打开了缺口。Qwen的情况也是一样,它的核心阵地是Hugging Face、GitHub和X,面对的是开源社区和全球AI开发者,这与阿里的核心资源甚至阿里云的关键客户群体风马牛不相及,但Qwen的影响力,正是在阿里的体系之外,靠开源社区的口碑,一点点攒起来的。甚至连Qwen的吉祥物,那只卡皮巴拉,俊旸都不愿意“劳动”阿里自己的设计师,而是在淘宝上花50块钱找人设计的。xUf哈希力量 | 通用人工智能文库

28,作为钉钉和Qwen的关键人物,生于1972年的无招和生于1993年的林俊旸,尽管岁数差了一代人的光景,很多特质却惊人的相似:特立独行、直率、坦诚,爱得罪人,有点儿疯。喜欢他们的人喜欢得不得了,恨他们的人恨得牙痒痒。通常他们在内部的树敌比在外部多,想保住他们是件并不容易的事儿。但是个稍微公道点的人就能看得出来他们对自己一手打造出来的产品的爱。无招把一切的时间都给了钉钉,俊旸也差不多,直到忽然宣布离职的前一天还在推广Qwen3.5小尺寸模型。无招和俊旸,都是各自产品独一无二的人格化代言人,他们的气质和他们所做的产品融合在了一起,而且能被轻易地感知到。xUf哈希力量 | 通用人工智能文库

29,当然最像的,是无招曾经的处境和俊旸今天面临的状况:靠自己的打法做起来,曾经连内部都不爱用的钉钉,成了阿里云企业级客户的核心抓手。阿里要的是“云钉一体”,把钉钉并入阿里云做企业客户获客工具,而无招坚持钉钉应该服务中小企业、独立发展甚至上市。在Qwen和俊旸这儿,面对的是阿里要Qwen的模型底座能力全面服务千问APP和阿里生态的商业化,但他们本身更在意基座模型的持续演进和Qwen的全球影响力,这是南辕北辙的两条路。所以,无招和俊旸都没办法体面退场,他们都不得不带着非常复杂的情绪,离开他们自己参与和付出了颇多的产品和业务。xUf哈希力量 | 通用人工智能文库

30,钉钉和Qwen其实共享了一个很有意思的叙事结构:都是在阿里体系的边缘地带,靠创始人/负责人的个人驱动力,面向阿里并不擅长的用户群体,用阿里不熟悉的方式把产品做起来的。然后一旦做大了,公司就想把它收编进自己熟悉的商业逻辑里——大企业客户或是C端商业化。xUf哈希力量 | 通用人工智能文库

31,但这又是很矛盾和令人纠结的地方:我不像很多为俊旸离开而惋惜的人那样,将一切归咎于阿里巴巴的文化。阿里的文化有它非常迷人的一面:看上去有点吝啬的容忍和保护,让边缘业务在无法“大力出奇迹”的情况下自行野蛮生长,前期的试错空间巨大,留白足够多。Qwen是如此,钉钉是如此,甚至连阿里云本身都如此,你会发现阿里如此庞大的组织在一些角落里是如此有弹性。但另一面是:边缘业务一旦做大做强,它便成了桃子,便要无条件融入跟它的初始设定并不一致甚至完全相反的业务,就要变成商业化的子弹,它们的灵魂人物就得被迫离开,甚至跟组织决裂。Qwen是这样,钉钉是这样,阿里云当初又何尝不是如此呢?xUf哈希力量 | 通用人工智能文库

32,无招离开后四年又被请了回来——因为阿里发现没有他的钉钉确实缺了灵魂,生意是做得不错了,但AI时代又需要产品型创始人。但回来的无招学乖了,他明白了钉钉其实不是他的。阿里会不会在未来某个节点意识到:开源社区的影响力其实很重要,千问的商业化离不开全球开源模型领导者的口碑,而这不是靠组织架构调整能补回来的,到时候再请人回来?还是说已经意识到了?xUf哈希力量 | 通用人工智能文库

33,我相信,钉钉和Qwen但的上半场脚本如此一致,但下半场的脚本应该彻底不同。因为时代不同了,环境更不同,当然,人也不同。xUf哈希力量 | 通用人工智能文库

34,比起俊旸,无招在阿里的羁绊太多了。其中最大的羁绊就是马老师,即便可能负气出走,但藕断丝连,离不开也不想离开。相比之下,靖人都不算是俊旸的羁绊,如果走了,那可就是真的走了。xUf哈希力量 | 通用人工智能文库

35,无招出走创业,对阿里内部那些看不惯无招的人来说,无外乎就是少了一个眼前的麻烦,离开了没准还能做朋友,回来了就再当敌人。“云钉一体”的竞争对手是华为、腾讯和国有云,再加个飞书,是中国自己一亩三分地的事儿。可是俊旸出走,那就真的只能在战场上见了。是字节的战场、腾讯的战场,还是Meta的战场、Google的战场、Grok的战场.......一切皆有可能。AI时代的头部人才的稀缺程度,远远高于移动互联网时代的产品大拿。xUf哈希力量 | 通用人工智能文库

36,过去的三年,全球的AI界经历了太多的内部倾轧、斗争、厮杀、背叛、分裂和媾和,放大了碳基生物的人性脆弱和不堪。一切无他,因为人聪明且自负,利益诱惑又如此巨大,未来看似一切都有可能,又一切都是未知。每个人在认为自己将得到什么的时候,也会盘算自己失去的会不会更多。xUf哈希力量 | 通用人工智能文库

37,阿里肯定会努力证明没有林俊旸的千问还是那个千问,甚至是更好的千问。但事实上,它已经失去了很多东西。xUf哈希力量 | 通用人工智能文库

38,与无招不同,很多失去的人、口碑和影响力,可能是回不来的。xUf哈希力量 | 通用人工智能文库



哈希力量文库选录,手机端省略本文网址