微软不得不救OpenAI的六个原因(译文)

Mary Branscombe ☉ 文 来源:51CTO技术栈
2023-11-27 @ 哈希力量文库

文库划重点:最近推出的Copilot Studio是一个低代码工具,用于使用业务数据和适用于JIRA、SAP ServiceNow和Trello等常用工具的Copilot插件来构建自定义Copilot。这可能会让OpenAI变得无处不在。为了实现这一目标,微软建立了一个内部管道,采用OpenAI的新基础模型。


尽管有这个名字,OpenAI从来都不是一个主要的开源组织,在开源的少数几个版本中,没有一个是核心大型语言模型。而相较之下,微软正在缓慢拥抱开源,它开源了PowerShell和VS Code等核心项目,同时微软也开始在Windows Server和Azure中依赖Docker、Kubernetes等开源项目,这是耐人寻味的。o5w哈希力量 | 通用人工智能文库

OpenAI,作为生成式AI的宠儿,近期却陷入了一场混乱且闹剧般的解体“连续剧”中。微软,就像是一位老大哥,坚定而友好地进行了干预,宛如一个成年人走进房间平息孩童的争吵。o5w哈希力量 | 通用人工智能文库

聘请奥特曼、聘请大部队、“遣返”奥特曼、寻求在董事会中占据一席之地,纳德拉带领着微软采取一切措施保住OpenAI。o5w哈希力量 | 通用人工智能文库

最后,随着Sam回归OpenAI,董事会换血,这场冲突大戏历经几番曲折,终于落下帷幕。但外界的争论点已经转移到“OpenAI依懒性”方面。o5w哈希力量 | 通用人工智能文库

不止采用GPT的中小企业对OpenAI的结算感到恐慌,即便是微软,也不得不出手挽救。OpenAI如果不稳定,对谁也没好处。o5w哈希力量 | 通用人工智能文库

一、微软跟OpenAI,不止是金钱关系o5w哈希力量 | 通用人工智能文库

在刚刚过去的Ignite会议上的开场主题演讲中,微软CEO纳德拉对OpenAI名称的提及高达12次,对GPT模型提及高达19次。尽管拥有自己非常出色的AI研究人员以及足够庞大的基础模型,但微软依旧非常关心OpenAI的ChatGPT。o5w哈希力量 | 通用人工智能文库

o5w哈希力量 | 通用人工智能文库

多年来,微软在OpenAI上投入了大量资金,尤其在今年,微软更是对OpenAI进行了100亿美元的投资,这即便对于微软来说,也绝对是一笔巨款。o5w哈希力量 | 通用人工智能文库

然而,除了巨款,不要低估了微软对于创建AGI的野心。短期看,这是一个无法完成的计划,但微软很难说没有这样的新愿景:微软希望人们将其视为“AI公司”,特别是“Copilot公司”,而不是“Windows公司”。o5w哈希力量 | 通用人工智能文库

2021年,微软豪掷197亿美元收购了Siri背后的智能语音识别巨头Nuance,2019年,微软在GitHub上花费了75亿美元。o5w哈希力量 | 通用人工智能文库

同样,微软今年也通过高额投资的方式拿到了ChatGPT的技术基础,并成功整合到自己的云端。现在我们看到的是微软通过在(Azure)云上来运行OpenAI的大型语言模型,扩大了Azure的市场份额和盈利。o5w哈希力量 | 通用人工智能文库

云,只是冰山一角。微软自己的产品同样采用了OpenAI技术,这是许多Copilot的核心。o5w哈希力量 | 通用人工智能文库

为什么?因为OpenAI同样在微软的硬件和软件方面投入了巨大,几乎所有部门和产品线都采用OpenAI技术,进而产生了一定的技术依懒。o5w哈希力量 | 通用人工智能文库

二、微软的野心与打法离不开OpenAIo5w哈希力量 | 通用人工智能文库

大型语言模型和其他基础模型一样,需要大量的数据、时间和计算能力来训练。o5w哈希力量 | 通用人工智能文库

微软投入巨大,如何“开发”出大模型的价值?o5w哈希力量 | 通用人工智能文库

微软的打法很清晰:将大模型视为平台,一次性构建一些模型,然后以越来越定制化和专业化的方式一遍又一遍地进行重用。o5w哈希力量 | 通用人工智能文库

具体的例子就是,这五年来,微软一直在构建Copilots的技术栈,改变从底层基础设施和数据中心设计(2023年,平均每三天就启用一个新数据中心)到软件开发环境的一切,以提高效率。o5w哈希力量 | 通用人工智能文库

从GitHub Copilot开始,现在几乎每个Microsoft产品线都具有一项或多项Copilot功能。它不仅仅是为消费者和办公室工作人员提供Microsoft 365 Copilot、Windows Copilot、Teams、Dynamics和重命名的Bing Chat,或者Power BI中由GPT支持的工具;从安全产品(如Microsoft Defender 365)到Azure基础设施,再到Microsoft Fabric和Azure Quantum Elements,都有Copilot。o5w哈希力量 | 通用人工智能文库

除此之外,微软客户还基于同一堆栈上构建了自己的自定义Copillot。纳德拉列举了6个例子——从Airbnb和BT,到NVidia和Chevron。o5w哈希力量 | 通用人工智能文库

同时,最近推出的Copilot Studio是一个低代码工具,用于使用业务数据和适用于JIRA、SAP ServiceNow和Trello等常用工具的Copilot插件来构建自定义Copilot。这可能会让OpenAI变得无处不在。o5w哈希力量 | 通用人工智能文库

为了实现这一目标,微软建立了一个内部管道,采用OpenAI的新基础模型,在Power Platform和Bing等小型服务中进行实验,然后利用从中学到的知识,将它们构建成开发人员可以使用的更专业的AI服务。o5w哈希力量 | 通用人工智能文库

这个内部管道对语义内核和提示流进行了标准化,以便使用Python和C#等传统编程语言编排AI服务(并在新的Azure AI Studio工具中为开发人员建立了一个友好的前端)。这些工具可帮助开发人员构建和理解由大模型支持的应用程序,而无需了解大模型。但它们依赖于OpenAI模型方面的专业知识。o5w哈希力量 | 通用人工智能文库

三、硬件合作还没开花怎能就此凋零o5w哈希力量 | 通用人工智能文库

微软将在OpenAI所依赖的硬件基础设施上进行大量投资。具体而言,他们计划投资于Nvidia和AMD的GPU,这些GPU是OpenAI模型训练和推理的关键组成部分。除此之外,微软还将投资于高带宽的InfiniBand网络互连,以确保节点之间的快速和高效通信。o5w哈希力量 | 通用人工智能文库

值得一提的是,微软去年收购了Lumensity,一家专注于低延迟空心光纤(HFC)制造的公司。这种光纤技术将在微软的硬件基础设施中发挥重要作用,提供更快速、更可靠的数据传输。o5w哈希力量 | 通用人工智能文库

这些投资不仅仅针对某一个特定的基础模型,而是旨在提升整个OpenAI平台的性能和稳定性。通过这些举措,微软希望确保OpenAI能够继续保持在生成式人工智能领域的领先地位。o5w哈希力量 | 通用人工智能文库

目前,OpenAI不仅在Tops500榜单上的Nvidia驱动的AI超级计算机上进行了合作,甚至还对Maia100(微软发布的首款AI芯片)进行了一些改进。o5w哈希力量 | 通用人工智能文库

微软的客户之中,同样想要类似的基础设施,又或者只对在该基础设施上运行的服务感兴趣(微软提供的几乎所有产品和服务都是如此)。o5w哈希力量 | 通用人工智能文库

在此之前,微软AI加速的主要手段是利用FPGA(现场可编程门阵列)的灵活性。最初,这些硬件被用于加速Azure网络,后来成为Bing搜索的加速器,用于实时AI推理。此外,服务开发人员也可以使用它在AKS上扩展自己的深度神经网络。o5w哈希力量 | 通用人工智能文库

随着新的人工智能模型和方法的出现,微软能够重新编程FPGA,创建软定制处理器,从而更快地加速这些模型和方法。相比之下,构建新的硬件加速器可能很快就会过时。o5w哈希力量 | 通用人工智能文库

FPGA的巨大优势在于,微软不需要预先确定它认为人工智能在未来几年将需要的系统架构、数据类型或运算符。相反,它可以在需要时不断修改其软件加速器。事实上,您甚至可以在工作过程中重新加载FPGA的功能电路。o5w哈希力量 | 通用人工智能文库

然而,上周微软宣布了第一代自定义芯片:Azure Maia AI加速器。这款加速器配备了定制的片上液体冷却系统和机架,专门用于“大型语言模型的训练和推理”,将运行OpenAI模型Bing、GitHub Copilot、ChatGPT和Azure OpenAI服务。o5w哈希力量 | 通用人工智能文库

这是一项重大投资,将显著降低训练和运行OpenAI模型的成本和用水量。但只有当训练和运行OpenAI模型继续成为主要工作量时,这些成本节约才能实现。o5w哈希力量 | 通用人工智能文库

这一新举措显示了微软对于AI领域的深度投资和长远规划,同时也反映了FPGA和定制芯片在AI加速领域的互补性。o5w哈希力量 | 通用人工智能文库

从本质上讲,微软刚刚构建了一个可软定制的OpenAI硬件加速器,直到明年才会部署到数据中心,未来的设计已经规划好了。这并不是微软与OpenAI亲密伙伴崩溃的最佳时机,否则连锁反应难以现象。o5w哈希力量 | 通用人工智能文库

四、微软的增长飞轮需要保持转动o5w哈希力量 | 通用人工智能文库

那为什么微软不收购OpenAI呢?o5w哈希力量 | 通用人工智能文库

尽管微软过去多年来可能一直提出收购建议,但起初它并没有打算收购OpenAI。相反,微软特意选择与公司外部的团队合作,以确保其正在构建的人工智能训练和推理平台不仅仅满足自身需求,而是更加普遍适用。o5w哈希力量 | 通用人工智能文库

然而,随着OpenAI的模型在竞争中不断取得领先地位,微软对这些模型的押注也越来越大。事实上,OpenAI的ChatGPT在推出仅一年后就宣称每周拥有1亿用户,甚至使得OpenAI不得不暂停ChatGPT Plus的注册,因为新订阅者的数量过于庞大。o5w哈希力量 | 通用人工智能文库

而这还不包括微软直接客户对OpenAI的使用量,这进一步证明了OpenAI模型的受欢迎程度和市场份额。o5w哈希力量 | 通用人工智能文库

真相就是,无论你使用OpenAI中的ChatGPT,还是Microsoft产品中内置的OpenAI模型,它都可以在Azure上运行。微软所谓的“第一方服务”(它自己的代码)和“第三方服务”(来自其他任何人)之间的界限已经变得相当模糊。o5w哈希力量 | 通用人工智能文库

五、客户开始考虑换竞对o5w哈希力量 | 通用人工智能文库

尽管OpenAI的开发者关系团队一直在努力向客户保证“我们的灯依然亮着”,系统仍在稳定运行,且工程团队随时待命,但据报道,OpenAI的客户已经开始与竞争对手Anthropic和Google进行接触。o5w哈希力量 | 通用人工智能文库

这其中甚至可能包括微软不愿失去的Azure OpenAI客户。例如,初创公司LangChain,它是一家为创建LLM支持的应用程序构建框架的公司,刚刚宣布与Azure OpenAI服务进行重大集成。然而,它也一直在向开发人员分享关于如何切换到不同的LLM需要对提示工程进行重大更改的建议。目前,大多数示例都是针对OpenAI模型的。o5w哈希力量 | 通用人工智能文库

o5w哈希力量 | 通用人工智能文库

LangChain发布的切换LLM用例o5w哈希力量 | 通用人工智能文库

六、OpenAI:微软严重的依赖项o5w哈希力量 | 通用人工智能文库

很明显,在微软,几乎所有部门和产品线都拥着同样的内部GPT版本,引入尽可能多的OpenAI专业知识并简化,对于微软而言dui显然是更加高效的,如果OpenAI分裂或消失了,一切都会变得棘手。o5w哈希力量 | 通用人工智能文库

正如微软CFO Amy Hood所说:“对所有OpenAI IP的广泛永久许可”,直到AGI(如果发生的话)。然而,今天的大模型,还不够。Microsoft在期待获得像GPT-5这样的大模型的到来。o5w哈希力量 | 通用人工智能文库

尽管有这个名字,OpenAI从来都不是一个主要的开源组织,在开源的少数几个版本中,没有一个是核心大型语言模型。而相较之下,微软正在缓慢拥抱开源,它开源了PowerShell和VS Code等核心项目,同时微软也开始在Windows Server和Azure中依赖Docker、Kubernetes等开源项目,这是耐人寻味的。o5w哈希力量 | 通用人工智能文库

话说回来,相较于对开源的依赖而言,微软如今对OpenAI的依赖更加严重。讽刺地是,OpenAI的稳定性和治理能力多少让人大跌眼镜。o5w哈希力量 | 通用人工智能文库

因此,无论如何,微软都要不惜一切措施确保OpenAI能够活下来,正如同我们看到的。o5w哈希力量 | 通用人工智能文库

原文链接:https://analyticsindiamag.com/microsoft-doesnt-really-need-openai-it-wants-agi/o5w哈希力量 | 通用人工智能文库

编译 | 言征,责任编辑:武晓燕o5w哈希力量 | 通用人工智能文库



收录于哈希力量,手机站省略本文固定网址