当亚马逊网络服务(AWS)于 10 月 20 日断电时,头条新闻关注的是它如何影响社交媒体和流媒体中断。但其连锁反应却更为深远。这次中断表明,我们的生活已经与云基础设施紧密相连。它甚至让一些用户的智能床变成了无用的 "湿袋子"。
亚马逊后来证实了问题的起因。故障被追溯到位于弗吉尼亚州北部的 US-East-1 区域。这是其分布式数据库服务 DynamoDB 出现故障并引发连锁反应的地方。该故障阻止了新的在线连接。这中断了 EC2 虚拟机、网络负载平衡器和依赖的后端 API。通俗地说,互联网最关键的数据动脉之一被堵塞了,全世界都感受到了这一点。
被云关闭的智能床
Eight Sleep公司价值7000美元的Pod就是意想不到的受害者之一。Pod 是一款智能床垫,利用水循环和人工智能温度映射来优化睡眠。AWS 服务器宕机也影响了这家睡眠科技公司。
Pod 系统对基于云的机器学习和实时生物识别同步的依赖使其容易受到影响。由于其算法和用户数据都在 AWS 服务器上运行,因此这次宕机使其暂时失去了作用。事实上,一位用户报告说,床的一侧温度过高,达到了 110 华氏度。
Eight Sleep 推出 "中断模式 "修复方案
对此,Eight Sleep 首席执行官 Matteo Franceschetti 在 X 上确认了这一问题,并承诺会进行修复。在 24 小时内,该公司推出了一种蓝牙低能耗后备方案,他们称之为 "断电模式"。这是一个本地控制层,绕过了云 API,实现了设备与应用之间的直接通信。当互联网出现故障时,用户可以通过蓝牙调整床铺。
与此同时,AWS 工程师花了几个小时来恢复服务。一旦服务恢复,他们就会重启核心系统,直到重新建立连接。亚马逊发布了一份正式道歉声明,称此次故障为 "重大事件"。他们承诺将实施架构保障措施,以防止类似事件再次发生。但这种情况已经不是第一次发生了。
亚马逊云中反复出现的薄弱环节
长期以来,美东一号地区一直是 AWS 的致命弱点。具有讽刺意味的是,它是这家云计算公司历史最悠久、流量最大的中心。然而,在 2021 年、2023 年和 2024 年,它都是故障的中心,中断了 Disney+、Slack 和 Zoom 等主要服务。
每一次,AWS 内部依赖关系中的连锁故障都会放大最初的孤立系统问题。此后,工程师们警告说,工作负载在特定区域的过度集中会带来系统性风险。这可以通过更智能的负载分配和区域冗余来缓解。
云依赖:系统性问题
虽然这个故事听起来很有趣,但它让人们注意到一个日益严重的问题:依赖云的硬件的脆弱性。AWS、谷歌云(Google Cloud)和微软云(Microsoft Azure)共同承载着大多数联网设备所依赖的后台系统。它们被用于从恒温器到医疗监视器等各种设备。当它们瘫痪时,人们认为是独立的设备也会瘫痪。
消费者权益倡导者认为,应该引入 "功能权 "标准,要求即使云服务出现故障,核心功能也能继续工作。本地备用系统,如设备上的人工智能或蓝牙控制,可以保持可用性,减少对遥远数据中心的依赖。
Eight Sleep 事件应该敲响警钟,"智能 "革命的可靠性取决于其背后的服务器。在硬件制造商优先考虑本地控制之前,即使是上床睡觉这样简单的事情,也可能取决于数据中心是否保持清醒。
» Notebookcheck多媒体笔记本电脑Top 10排名
» Notebookcheck游戏笔记本电脑Top 10排名
» Notebookcheck低价办公/商务笔记本电脑Top 10排名
» Notebookcheck高端办公/商务笔记本电脑Top 10排名
» Notebookcheck工作站笔记本电脑Top 10排名
» Notebookcheck亚笔记本电脑Top 10排名
» Notebookcheck超级本产品Top 10排名
» Notebookcheck变形本产品Top 10排名
» Notebookcheck平板电脑Top 10排名
» Notebookcheck智能手机Top 10排名
» Notebookcheck评测过最出色的笔记本电脑屏幕
» Notebookcheck售价500欧元以下笔记本电脑Top 10排名
» Notebookcheck售价300欧元以下笔记本电脑Top 10排名





