谷歌就长达数小时的云服务宕机事件致歉并发布事故报告: 谷歌就一起重大服务宕机事件致歉,该公司称事故由近期多层级的缺陷更新所致。公司于周五晚发布事故报告,详细说……
哈喽!伙伴们,我是小智,你们的AI向导。欢迎来到每日的AI学习时间。今天,我们将一起深入AI的奇妙世界,探索“谷歌就长达数小时的云服务宕机事件致歉并发布事故报告”,并学会本篇文章中所讲的全部知识点。还是那句话“不必远征未知,只需唤醒你的潜能!”跟着小智的步伐,我们终将学有所成,学以致用,并发现自身的更多可能性。话不多说,现在就让我们开始这场激发潜能的AI学习之旅吧。
谷歌就长达数小时的云服务宕机事件致歉并发布事故报告:
谷歌就一起重大服务宕机事件致歉,该公司称事故由近期多层级的缺陷更新所致。公司于周五晚发布事故报告,详细说明周四发生的数小时服务中断情况。全球超 70 项谷歌云服务停止正常运行,导致 Cloudflare、OpenAI、Shopify 等数十家第三方服务瘫痪或受干扰,Gmail、谷歌日历、谷歌云端硬盘、谷歌 Meet 等第一方产品也出现故障。
事故报告显示,谷歌于 5 月为评估自动传入请求的 “配额策略检查” 添加了新功能,但该功能未立即在真实场景中测试。因此,系统无法正确处理新功能产生的数据(包括空白条目)。这些空白条目随后被发送至所有谷歌云数据中心区域,引发系统崩溃。据谷歌称,工程师在 10 分钟内定位了问题,但由于部分大型区域因崩溃出现过载,整个事件持续了 7 小时。
谷歌还提到,推出该功能时未使用 “功能标志”—— 这是行业内日益普遍的做法,可通过缓慢部署新功能来降低问题发生时的影响。若使用功能标志,本可在问题扩散前发现隐患。谷歌表示将调整架构,确保单一系统故障时其他系统仍能运行,避免连锁崩溃。此外,公司将审计所有系统,并改进自动化和人工通信机制,“让客户尽快获取应对问题所需的信息”。
嘿,伙伴们,今天我们的AI探索之旅已经圆满结束。关于“谷歌就长达数小时的云服务宕机事件致歉并发布事故报告”的内容已经分享给大家了。感谢你们的陪伴,希望这次旅程让你对AI能够更了解、更喜欢。谨记,精准提问是解锁AI潜能的钥匙哦!如果有小伙伴想要了解学习更多的AI知识,请关注我们的官网“AI智研社”,保证让你收获满满呦!
还没有评论呢,快来抢沙发~