谷歌今年最成功的两款AI应用,都出自他手
文库划重点:Josh Woodward,42岁,现任Google Labs副总裁兼Gemini应用负责人。作为谷歌从搜索优先向AI优先转型的核心人物,今年4月,Woodward全面接手了谷歌AI战略核心Gemini应用的工作。在此期间性能强大的Gemini 3.0系列模型、以及生成式界面等一系列创新功能。
Gemini模型今年很强,谷歌旗下的AI应用也开始支棱起来了。
一直备受好评的NotebookLM,今年接连发布新功能,目前移动端月活用户达到800万。
Gemini App月活从8月的2.66亿增长到了11月的3.46亿,净增8000万用户。在四个月内,Gemini市场份额上升3个百分点,反观ChatGPT市场份额下降了3个百分点。
过去一年内,付费用户的增长更为突出,Gemini Pro订阅量同比增幅接近300%,大幅领先于ChatGPT的155%增速。
这股势头背后,离不开一个关键人物:Josh Woodward,Google Labs副总裁兼Gemini应用负责人。

今年4月,Woodward全面接手了谷歌AI战略核心Gemini应用的工作。对比其他大厂高管,Woodward身上,有一股独特的创业者气质:
- 快速行动,看重从一个点子到最终交到用户手里的速度。NotebookLM以5、6人的小团队形式,用六周时间快速完成了原型开发;
- 懂技术,且有远见地能思考技术未来的演变方向和合适的应用方式。在Gemini 3.0的发布中,Woodward提出了非常前瞻的概念:生成式界面。
- 聚焦真实用户的反馈。非常痴迷解决用户在使用产品时遇到的微小痛点,常在X、Reddit等社交平台上和用户交流;
- 有能力绕开谷歌庞大的官僚体系。建立了block内部系统,帮助团队推进项目,打破内部障碍,争取资源;
谷歌实验室前联合负责人Clay Bavor这样评价Woodward:行动迅速、善于打破障碍、执行力强,这些能力让他稳稳地立在了谷歌最重要工作的中心。
01
Google ToC AI应用的真正一把手
Josh Woodward,42岁,现任Google Labs副总裁兼Gemini应用负责人。
作为谷歌从搜索优先向AI优先转型的核心人物,今年4月,Woodward全面接手了谷歌AI战略核心Gemini应用的工作。在此期间,推出了在社交平台爆火出圈的Nano Banana、性能强大的Gemini 3.0系列模型、以及生成式界面等一系列创新功能。
在他的领导下,Gemini应用的月用户数从3.5亿激增到了6.5亿。
在接管Gemini之前,Woodward负责带领Google Labs,探索各种实验性AI项目。其中,团队推出的笔记产品NotebookLM,大受好评。Woodward开启了内部创业模式,组建了5-7人小组,仅用六周时间就完成了首个原型开发。
CNBC评论,Woodward的优势之一是消除障碍,使团队能够快速开发产品。
快速行动、突破常规的行事风格贯穿了Woodward在谷歌的16年职业生涯。2009年,Woodward以产品管理实习生的身份加入谷歌,随后担任了多个产品管理职位,也是谷歌开拓新兴市场下一个十亿用户(NBU)项目的首批核心成员。
除了强大的执行力外,Woodward身上还有一种独特的创业者气质:好奇心和影响力。在NBU期间,Woodward每周都会撰写一份内部通讯,分享近期思考和感兴趣的东西。Woodward的阅读量极大,甚至成为了谷歌高管们寻求书籍推荐的首选对象。
在过去一年中,Woodward是如何做到带领Gemini甚至整个谷歌走出低谷的?我们梳理了他在关键产品上的核心策略、技术思考与管理理念,或许能找到答案。
02
突破大公司病,
快速开发新产品
2022年,Woodward加入Google Labs后,迅速成为了多款高影响力产品开发的核心。
NotebookLM就是Google Labs团队早期开发出的一款AI产品。最初源自于团队内产品经理Raiza Martin的个人项目Project Tailwind,一个笔记工具创意。
Woodward以内部5到7人小组的形式,基于这个创意源点,进行快速迭代开发,六周时间就完成了产品首个原型开发。从一个简单的笔记工具,打造成了一款能深度分析用户上传的文档、PDF、音视频,并提供摘要和洞见的AI产品。
NotebookLM在2023年7月发布后,一炮而红,迅速获得了极高的人气。在为了收集用户反馈而建立的Discord服务器中,有20多万成员。
AI不是目的,是一种全新的内容容器
Woodward对于AI工具价值的理解,非常深刻。他认为,AI不仅仅是一个从海量互联网信息中提取答案的搜索引擎,而是更应该成为一个帮助用户去深度理解、重构自有知识的伙伴。所以,NotebookLM的一切分析、摘要和回答,都是严格基于用户上传的原始资料,规避了常见的幻觉问题。
Woodward将NotebookLM形容为一种新的内容容器或格式。这个容器被直观地呈现在了产品界面上:左边是用户上传的原始资料,中间是与AI的问答互动,右边则是能生成思维导图、摘要等丰富的媒体输出。所有内容都有源可溯,保证了思考的严谨性。
这个核心理念,同样在视频概览和音频概览功能上也体现得非常明显。例如,音频概览功能,用户可以上传多个信源,让AI来生成一期播客;视频概览功能,用户可以上传数十个、甚至上百个不同格式的资料,最后自动生成一个图文并茂、带有语音讲解的视频幻灯片。
NotebookLM将海量、零散的信息,提炼成了一个几分钟就能消化吸收的精华版本。
这也侧面反映了Woodward对于NotebookLM核心价值的判断:在整理-输出环节,AI拥有非常丰富的探索空间,能够帮助用户用全新的方式来转换、重构信息。
这种转换,本质上降低了高质量内容创作的门槛。整理信息同样也是一种创造。
Woodward在播客中提到,团队的最终目标是,既能帮助顶尖人才更快、更有创意地完成工作,又能让那些原本不具备能力的人也能做到。
放手让他们去做的大胆行事风格
Woodward的行事风格快速、大胆,也是让NotebookLM这个新品类产品成功的重要原因。
Woodward敢于突破大厂中的官僚主义。为了更好地收集用户反馈,NotebookLM使用了更贴近普通用户的外部平台Discord,这对于像谷歌这种更倾向使用自家产品的大公司,是非常不容易的。
据当时的项目负责人Martin回忆,行政部门不断追问:为什么不用Google Meet?为什么不用Google Groups?是Woodward亲自出面协调,确保了团队可以继续使用Discord。产品首批上线的新功能都是源自于Discord中与使用者的反馈、交流。目前,该频道已经有23万名成员。
另一个非常大胆的举动是,Woodward邀请了与谷歌毫无交集的外部科技作家Steven Johnson加入团队,来共同打磨NotebookLM。Woodward本人是Johnson的忠实读者,他认为,通过这位科技史作家的视角,可以为产品带来不同的价值。
Johnson带来了不同的视角:最好的思想往往诞生于不同信息的碰撞。NotebookLM被设计成能够发现连接的工具,能指出用户上传的生物学论文和建筑学笔记之间的潜在联系。这种设计超越了单纯的搜索检索,进入了辅助思考的领域。
Johnson在后来的采访中提到这次合作,称赞Woodward的管理方式,能够放手让他们去做。
也正是Woodward这种大胆的行事风格的推动,让谷歌重新具备了推出NotebookLM这种新品类产品的能力。
03
8个月时间,
带领Gemini App走出低谷
AI Agent公司Sierra联创Bavor对Woodward的评价是:他是公司里最早看到LLM在产品构建方面潜力的人之一,且完全理解一项新技术,能够有远见的预见到技术未来的演变方向和应用方式。
这一点,在Woodward接管Gemini应用后的一系列动作上,体现得非常明显。
图像生成功能Nano Banana
Nano Banana功能的火爆出圈,是Woodward团队对消费级市场的敏锐发现。
今年8月,Woodward团队在Gemini应用中推出了图像生成器Nano Banana。该模型在技术上解决了当时AI生图的两个核心痛点:能在图片中相对准确地渲染文字,且在生成系列图片时保持了出色的角色一致性。
生成迷你手办的各类玩法迅速通过社交媒体传播,形成了病毒式增长。
Woodward团队的应对方式,也从侧面展现他们的产品策略:快速观察、简化并放大用户的自发创造力。
Woodward提到,现在我们把这个流程做得非常简单。你只需打开Gemini主页,点击这个功能,上传一张图片,就能生成一个七分之一比例的手办模型,提示词我们都已经预设好了。观察用户行为,然后把它变成一个默认提示词放在首页。同时,团队还迅速将一些用户高频生成场景,固化成一键可用的功能,极大地降低了普通用户的参与门槛。
这种策略的效果非常惊人。到9月底,Gemini生成的图像数量突破了50亿张,应用在苹果应用商店的榜单上超越了OpenAI的ChatGPT。Gemini应用的月活跃用户数从3月的3.5亿猛增至10月的6.5亿。
AI的未来交互将远超当下的聊天框
Woodward认为,第一代Nano Banana模型在对话式编辑方面是一个巨大的飞跃。对话式编辑意味着用户不仅能通过文本生成图像,还能通过后续的自然语言指令,对图像进行不断的修改和迭代,比传统的一句话,一张图模式要深入得多。
Nano Banana功能的实现源自于Gemini模型的核心架构。Woodward强调,Gemini模型从一开始就是多模态的,这和市场上其他一些模型非常不同。原生的多模态能力,意味着模型不是简单地将文本、图像、音频等不同模块拼接在一起,而是在底层就具备了对不同信息形态的统一理解和处理能力。这也是像Nano Banana这样看似简单的功能,能够实现复杂、流畅的跨模态创作的根本原因。
进一步,Woodward认为,未来AI的交互将远超当下的聊天框形式。AI终极形态应该是能够根据用户需求,即时生成可交互的界面、组件甚至微型网页。
在Gemini 3.0的发布中,Woodward提出了一个非常前瞻的概念:生成式界面(Dynamic View)。AI不再只是生成内容,它开始实时动态生成一个为用户搜索量身定制的可视化界面。例如,教师可以利用Gemini 3.0实时生成互动的学习小部件或网页,来支持个性化和适应性学习。这一功能目前已经在Gemini App中测试。
Woodward认为,这类生成界面是新颖且令人兴奋的开始,AI的交互将不再局限于传统的一问一答模式。语音、图像和视频等更动态、更丰富的多模态交互方式,将逐渐成为主流。
每当有重大技术变革时,通常都会伴随着输入输出方式的转变。我们现在才刚刚开始,还有大量的创新空间。我们正在打破那些非常刻板的输入输出模式,转向一种可能更动态、流畅的交互方式。
通过上下文工程,打造一个主动式的私人助手
Woodward对Gemini应用最终的定位是:个人化生活助手。Woodward提到,AI助手核心要素是三个P:个人化(Personal)、前瞻性(Proactive)、功能强大(Powerful),其中个人化应该放在首位。
现在Gemini团队收到的最多的用户请求之一就是:我想把我的Gmail、谷歌相册或者其他谷歌服务都接入到Gemini中。
Woodward认为,要实现真正的个性化,AI必须能够理解用户的个人上下文。在用户的许可下,AI能够深入理解个体的需求和生活轨迹。这背后的上下文工程非常重要。
AI的核心工作之一,就是让用户能够轻松地将模型引导至他们希望处理的特定信息池。而Gemini模型从诞生之初就具备的原生多模态能力,正是实现这一点的基础。能够无缝地整合文本、图像、音频、视频等多种信息源,为AI提供一个丰富且立体的用户上下文。
Woodward认为,未来的Gemini更像是一个真正的私人助手。用户可以向它询问具体的问题,比如从收件箱深处找回某条信息,更可以探索那些宏大而开放的命题,例如我应该如何规划我们家未来几年的生活?或者我怎样才能成为一个更好的父亲?. 通过深度理解用户的个人数据和生活情境,Gemini 可以提供真正个性化的建议和支持。
04
Block系统绕过官僚,
组建全能型小团队
在以数据和流程著称的谷歌内部,Woodward的领导风格非常鲜明:能够快速行动、聚焦真实用户的反馈,以及有解决小而关键问题的能力。
建立block内部系统,打破内部障碍、绕过官僚系统
Woodward最广为人知的特质之一,就是他有能力绕开谷歌庞大的官僚体系。Woodward帮助建立了一个名为block的内部系统。任何员工一旦在项目中发现或者遇到潜在障碍,无论是资源、流程还是跨部门协作问题,都可以提交一条记录。Labs内部会有一个专门的团队负责解决。
这个机制确保了小团队的创新动力不会被大公司的惯性所消耗。比如,NotebookLM早期版本发布后,产品急需更多的TPU资源,就是通过这套内部协调机制,Woodward成功地为团队争取到了关键的计算资源。
Papercuts机制:从细微处赢得用户
Woodward非常痴迷解决用户在使用产品时遇到的微小痛点,来快速迭代产品。为此,他创立了一个名为Papercuts的流程,专门用于快速响应和解决影响用户体验的细枝末节问题。
同时,Woodward会X、Reddit等社交平台上向用户同步这些改进。10月,Woodward在X上发帖称:小改进已完成:现在你可以在Gemini App的对话中途更换模型,无需重新开始。
NotebookLM的前设计师Jason Spielman评价,Woodward这种对最终用户的投入程度,我在其他领导者身上从未见过。
早期产品的成功,数据不是唯一标准
Woodward认为,一个早期产品的成功与否,不能只看数据,更应该走出去,和真实的用户交流。
对于我们的很多产品,当我们第一次获得一万个周活或者日活用户时,都会特别兴奋。在谷歌很多团队,他们的统计后台可能都看不到这么低的数字。这些里程碑对我们非常重要,因为它初步验证了产品的用户留存能力。但在产品开发的早期,数据后台可能非常具有欺骗性。
所以,我总是告诉团队:你要看数据,培养数据直觉,但你更要走出去,和真实的用户待在一起。
因为当你做出一个真正了不起的东西时,你从他们使用时的眼神里就能看出来。他们可能会微笑,或者会以一种有趣、惊喜的方式感到惊讶。这些都是我在项目早期阶段总会寻找的更偏向定性的东西。在Woodward看来,在创新的初期,产品开发更多是艺术而不是科学。
在谷歌内部建立起快速发布产品的文化
如何在谷歌内部建立快速产品发布文化,Woodward分享了三个核心要点。
一是保持极小的团队规模。Google Labs的新项目通常是由一个5-7人的核心团队启动。Woodward分享,我早期产品生涯中犯的一个错误是,过早地组建了太大的团队,这会制造出很多工作,但你连产品是什么都还不确定。
团队只有在明确捕捉到市场拉力后,才会相应地扩大规模。例如,NotebookLM团队早期只有几名成员,在获得初步的市场反馈后,才逐步扩大团队变成了十人,再到二十人,再到五十人,最后到八十人。
Woodward在一次采访中提到,每一个伟大的产品,最初都只是来自少数几个心怀梦想的人。但在谷歌这样一家已经拥有了一系列成功产品和业务的大公司里,想要从零开始做些小事,反而会很困难。这也是我们重启Labs的原因之一:我们希望有一个地方,能够专门去发现和打造那些具有高潜力的小项目,并悉心培育它们。
二是将推向用户作为最高优先级。整个流程的优化目标,就是尽快把产品交到真实用户手中,获取反馈。我们非常看重从一个点子到最终交到用户手里的速度。整个流程的优化目标,就是尽快把产品交到用户手里。因为只有当产品到了用户手里,你才真正意识到自己离目标还有多远。
以Flow为例。Flow是一个基于Veo 3模型的视频创作工具,首次给AI视频带来了音效。Flow项目从想法诞生,到最终在I/O大会上正式发布,交到用户手中,总共只花了86天。
Woodward认为,技术本身很重要,但如何把它包装好,让人们能最大限度地利用它,也同样重要。
在产品开发的早期阶段,最大的风险就是你做的东西没人需要。发现这个问题的时间拖得越久,代价就越大。
所以,我们的首要任务,就是在项目最初的50到100天内走出办公室,直接面向用户,和他们一起进行产品共创。
这种做法总能带来反馈,我们也常常在早期就发现,自己最看好的想法其实并不对。产品原型会被误解,核心功能会反响平平,一些基本假设也会被证明是错误的。
但这没关系。这是创新过程中必须付出的代价,走向成功的最好方法,就是尽可能快地迭代和学习。
三是在招聘团队成员时更倾向热爱动手的创造者。在面试时,会看候选人在业余时间会做些什么东西?喜欢动手、喜欢创造的人,会通过原型来表达自己,而不是通过文档。这是一个非常重要的因素。同时,更倾向于学习速度更快的候选人,且有『我能行』的积极心态。
(文章收录经过哈希力量格式优化,部分插图未收录)
https://mp.weixin.qq.com/s/-Zy9LpnKAAdQirQb4Hw3oA
哈希力量文库收录,手机端省略本文网址
