亞馬遜云服務宕機15小時沖擊上千家企業 云依賴風險已凸顯
時間:2025-12-01 18:46:23 出處:綜合閱讀(143)
10月20日,亞馬業云依賴已凸社交媒體開始流傳起亞馬遜網頁上的遜云小時顯各類小狗圖片,顯示頁面加載失敗,服務風險亞馬遜的宕機買家和賣家們戲稱,“今天是沖擊看狗的一天”。
崩掉的上千不只是亞馬遜自己的電商網站。社交平臺Snapchat、家企交易平臺Robinhood、亞馬業云依賴已凸PayPal旗下的遜云小時顯移動支付Venmo、加密貨幣平臺Coinbase、服務風險人工智能初創公司Perplexity等大量依賴AWS的宕機互聯網平臺均受到波及陷入癱瘓。
根源是沖擊亞馬遜云計算服務AWS遭遇大規模宕機,美西時間10月20日下午3點,上千持續約15小時的家企服務故障得到解決。據Downdetector數據,亞馬業云依賴已凸超400萬用戶報告了這次故障引發的問題,至少一千家公司的服務受到沖擊。
不過,盡管發生如此嚴重的大范圍服務中斷,亞馬遜股價卻并未受到很大影響,10月20日逆勢收漲1.61%至216.48美元/股。
“AWS這樣成熟的云廠商發生故障,暴露出了云廠在基礎設施可靠性和容錯性設計方面的一些薄弱之處,但IT界尤其是大公司發生技術故障并不少見。”IDC中國研究總監劉麗輝向21世紀經濟報道記者表示,“該故障發生可能會引發部分客戶的擔憂,但尚不足以對競爭格局產生太大影響。”
大型云服務廠商此前均出現過故障,波及多個大型網站,這仍引發了業內對于全球數字化基礎設施脆弱性的擔憂。尤其在AI帶動云計算需求爆發式增長的時代,如何構建既高效又可靠的云基礎設施,成為擺在企業和云服務商面前的共同課題。
AWS的護城河
美西時間10月20日凌晨12點左右,AWS的核心節點之一美國東部1區(US-EAST-1)首先報告出現“顯著的錯誤率和延遲”現象。
位于美國弗吉尼亞州北部的“US-EAST-1”數據中心是AWS歷史最悠久、規模最大的服務器集群之一,也是許多AWS服務的默認區域,其穩定性問題直接影響全球互聯網生態。
此次故障的根源在于AWS關鍵數據庫系統DynamoDB。這一故障引發骨牌效應,導致依賴該數據庫的多項AWS服務出現連鎖反應。亞馬遜工程師在故障發生后迅速定位問題,并開始修復,但由于云服務各組件間相互依賴,全面恢復耗時長達15小時。
不過令人意外的是,盡管發生如此嚴重的大范圍服務中斷,亞馬遜股價10月20日卻逆勢收漲1.61%至216.48美元/股。比起AWS中斷,投資者顯然更關注的是亞馬遜云部門的長期增長潛力。
很長一段時間,AWS都是亞馬遜的核心利潤部門,該業務2024年收入達1076億美元,占亞馬遜總收入的17%。運營利潤達398億美元,同比增長約62%,占總營業利潤的58%。
市場研究機構Synergy Research Group數據顯示,AWS占據全球云計算市場約30%份額,其余主要廠商包括微軟和谷歌。
在業內看來,云服務市場的進入壁壘日益增高,現有巨頭的規模效應和客戶鎖定能力已形成強大護城河。AWS的市場領導地位形成的網絡效應使其具備強大的客戶黏性,即使偶發服務中斷,企業客戶也因高昂的遷移成本而難以輕易轉向競爭對手。
“這次故障尚不足以對競爭格局產生太大影響,企業在選擇云廠商時會考慮基礎設施地域覆蓋、技術先進性、成本、安全、服務支持等多方面因素,AWS依然是綜合實力最強的云服務商之一。”劉麗輝向記者表示。
有分析指出,宕機事件可能會促使企業增加在網絡安全上的投入,云和數據中心提供商可能因此受益,而某種程度上仍包括亞馬遜。
不過,投資者們關注的增長故事也并沒有那么好講,今年以來AWS經歷更大的競爭和挑戰。第二季度,亞馬遜AWS營收309億美元、同比增長17.5%,明顯落后于微軟Azure的39%和谷歌云的32%,引發市場對其龍頭地位動搖的擔憂。
在決定未來云服務市場格局的人工智能領域,微軟和谷歌要更早、更快布局,AWS已承諾今年在AI領域的投資將高達1000億美元,以加快數據中心和軟件的建設。
而隨著競爭加劇和投資增加,AWS作為亞馬遜利潤引擎的角色也在發生變化。2025年第二季度,AWS的經營利潤為101.6億美元,對亞馬遜整體經營利潤的貢獻為53%,已基本降至一半。而在一年前的2024年第二季度,AWS的利潤貢獻曾高達64%。
月底即將到來的第三季度財報,市場也會更加關注。
構建更可靠的數字地基
雖然亞馬遜并未受到大程度影響,但這次事件的波及面之廣仍然引起了廣泛的探討:在追求效率與成本最優化的同時,企業是否忽視了風險?
當前,云服務已成為數字世界的基礎設施,而AI的快速發展更是加速了其擴張。當企業競相擁抱生成式AI和大型語言模型,它們對云計算的依賴只會加深。
對大型企業而言,數小時的云服務中斷就意味著數百萬美元的生產力和收入損失。根據網際網絡性能監控公司Catchpoint的估算,AWS此次服務中斷造成的經濟損失將至少達到數十億美元。
而這并非AWS首次大規模服務中斷。2023年6月13日,AWS曾宕機持續近4小時,導致美東區域多個服務中斷。
2021年12月7日,AWS其中一個數據中心遭遇故障,導致服務中斷長達5小時,包括航空公司、汽車經銷商、支付應用程序以及視頻服務等都受到嚴重影響。
對用戶來說,盡管依賴AWS、微軟Azure和谷歌云等大型云服務商,在多方面提升了全球網絡安全與穩定性,但企業選擇單一的云服務巨頭往往是既有利也有弊。
幾次大規模的宕機顯示出,這些云平臺正成為眾多關鍵服務的單一故障源,暴露出了冗余不足、替代方案缺位。不少專家指出,太多公司把“雞蛋”全放在一朵“云”籃子里。
網絡安全公司NymVPN首席數字官Rob Jardin在一份簡報中寫道:“互聯網最初的設計宗旨是去中心化、高韌性,可如今我們的線上生態卻高度集中于少數幾個云區域。一旦其中一個區域出錯,沖擊便瞬間擴散、波及全網。”
面對風險,企業也在重新審視其云方案。劉麗輝向記者表示,該故障可能會引發部分客戶的擔憂,進而影響他們對于多云選擇的思考。
混合云架構正在成為降低風險的重要方案,通過將關鍵工作負載分布在多個云服務商之間,或保留部分核心業務在私有云中,可以有效避免單一廠商鎖定帶來的系統性風險。
業內人士分析稱,多云策略雖然會增加初始復雜性和管理成本,但在發生大規模服務中斷時,能夠確保業務連續性,從長遠看具有明顯的風險抵御價值。
在不可逆轉的云端遷移大潮中,構建彈性、多元、韌性的數字基礎設施,已從可選項變為必選項。這次宕機風波最終會平息,但它留給企業的關于風險管理的思考,還會持續影響未來的技術決策和投資方向。
(作者:董靜怡 編輯:張星)