ChatGPT遭遇近8小时大规模宕机
文库划重点:OpenAI的状态页面显示,该公司在过去90天内发生了十几次中断,但通常在不到一个小时的时间内就得到了解决,周二的故障是最严重的一次。
当地时间6月4日(周二)下午,OpenAI的旗舰聊天机器人ChatGPT(包括网站、App和桌面应用)出现系统故障,导致全球数百万用户无法正常使用,持续长达近8个小时。
OpenAI在其官网上证实了此次系统宕机,称“我们经历了一次严重的服务中断,影响了所有的ChatGPT用户,但受影响的不包括platform.openai.com或API”。这意味着依赖OpenAI技术的第三方服务未受到影响,但OpenAI官方尚未公开具体的故障原因。
ChatGPT中断期间,大量用户转向Anthropic公司的Claude、谷歌Gemini和Perplexity等替代工具。其中,谷歌AI聊天机器人Gemini的搜索量激增至327058次,较5月4日至6月3日期间的204991次日均搜索量增长近60%。在流量激增之下,上述三大AI平台也遭遇了系统瘫痪,不过这些问题在几小时内迅速得到了解决。
对于此次AI服务器集体“罢工”的原因,有网友在X平台上发出疑问,还有网友表示这就像多米诺骨牌效应,一家公司算力不够导致其他公司访问量激增,从而集体瘫痪。
ChatGPT一天宕机两次
ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。当地时间周二下午,ChatGPT(包括网站、APP和桌面应用)出现系统故障。当时,在ChatGPT的主页面,提交按钮显示为灰色,用户无法给AI聊天机器人发送消息。随后,ChatGPT网站表示,服务已经满负荷,会在恢复服务时通知用户。
值得注意的是,ChatGPT在当天共发生了两次故障,首次故障出现在当日凌晨2点半左右,早上7点半左右OpenAI宣布故障已解决。然而,当日上午10点半左右,OpenAI报告正在调查第二次故障的原因,最终于当日下午1点左右,OpenAI宣布所有系统已恢复正常运行。也就是说,ChatGPT两次的宕机总时长近8个小时。
OpenAI的状态页面显示,该公司在过去90天内发生了十几次中断,但通常在不到一个小时的时间内就得到了解决,周二的故障是最严重的一次。
ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的全球中断,为所有依赖AI工具来支持业务的人敲响了警钟。想象一下,在产品发布等关键时刻失去对关键工具的访问权。这可能是毁灭性的!不要把所有的鸡蛋都放在一个篮子里,无论这个篮子有多大。”
据软件公司QRFY分析,在ChatGPT中断期间,谷歌AI聊天机器人Gemini的搜索量激增至327058次,较5月4日至6月3日期间的204991次日均搜索量增长近60%。该公司表示,“Microsoft Copilot”的搜索量也有所增长,但不如Gemini的搜索量增长那么显著。
QRFY首席执行官Marc Porcar指出,“ChatGPT中断和Gemini搜索量激增之间存在明显的平行趋势,这一事实表明人们认为Gemini是ChatGPT的明显替代品”。
AI服务器集体瘫痪
令人哭笑不得的是,在流量激增之下,Gemini、Claude和Perplexity也都遭遇了系统瘫痪,不过这些问题在几小时内迅速得到了解决。
瘫痪期间,Claude网站持续显示“服务器组件渲染时出现错误”,提醒用户系统正在处理中。Perplexity网站因为接收到太多请求,一度显示超出服务容量的信息,Perplexity提示用户:“我们很快回来”“我们现在收到很多问题,已经达到我们的处理能力(极限),请稍后再来。”Claude恢复正常工作后不久,Perplexity的网站也重新开始正常服务了。
对于此次AI服务器集体“罢工”的原因,有网友在X平台上发出疑问,“这是由于DDoS(分布式拒绝服务攻击)还是巧合”?还有网友表示这就像多米诺骨牌效应,一家公司算力不够导致其他公司访问量激增,从而集体瘫痪。
The Register报道称,根据受影响的用户的说法,宕机后ChatGPT无法响应用户的查询,这表明问题可能出在服务端的某个地方。当用户要求ChatGPT进行自我诊断时,其给出了一个简洁的回答——“内部服务器错误”。
《每日经济新闻》记者注意到,ChatGPT在2023年11月8日也曾遭遇宕机事件,持续时间超过2小时。起初,OpenAI的CEO阿尔特曼将服务器不稳定归咎于OpenAI使用量“远超预期”,这也是外界的普遍解读,但当OpenAI及时修复了ChatGPT中断之后,才发现这个解释并不全面。
经过调查,OpenAI官方认为,当时ChatGPT和API遭遇的重大故障是由网络攻击造成的,这种攻击疑似为DDoS,一个黑客组织已宣称对此负责。
DDoS是网络攻击的一种,旨在让系统资源消耗殆尽,使其无法回应服务请求。这种攻击由攻击者控制的大量受恶意软件感染的主机发起。DDoS之所以命名为“拒绝服务”,是因为会最终导致受害网站无法为用户提供服务,“分布式”则是指攻击的发出点分布在不同地方,攻击者可以有多个。
网络安全厂商StormWall的报告显示,2023年以来,DDoS攻击威胁不断升级,攻击量、强度和持续时间显著增长。
对于这类问题带来的管理责任,监测机构victoria ametrics的联合创始人Roman Khavronenko在X平台上发文称:“病毒式传播已经不再罕见,但能够处理病毒式传播流量的网站仍然太少了。如果数据是现代企业的命脉,为什么它仍然没有得到妥善管理?”
每经编辑 兰素英
收录于哈希力量,手机站省略本文固定网址