亞馬遜雲端服務AWS在香港時間昨(20日)下午起,突然發生重大故障,導致多項網絡服務大規模中斷,受影響的包括Amazon、Epic Games Store、Canva、Airtable、Perplexity等平台。而經歷約15小時的服務故障中斷後,AWS在香港時間今(21日)早上表示,所有服務已經恢復正常運作。
AWS「服務健康儀表板」在今早上更新,表示所有服務均「恢復正常運作」。回顧昨日死機狀況,AWS稍早就透露,事件起因於一個關鍵資料庫服務的數碼目錄出現故障,導致依賴這個資料庫的軟件無法取得資料,引發了連鎖故障。
AWS指出,在紐約周一清晨時已經找出並修復根本原因,受影響的主要是位於美國東岸的資料中心叢集(Data cluster),這也是AWS最大的資料中心叢集。但在修復過程中,有工程師發現其他子系統也受到波及,包括一個客戶用於啟動新的租賃伺服器所必須使用的子系統已遭到資料庫服務中斷的影響。
Duckbill Group首席雲端經濟分析師Corey Quinn直言,是次故障可能是自2021年12月重大中斷以來AWS經歷的最嚴重事件,或是凸顯我們的網絡連結更加緊密、更加依賴亞馬遜了。這次事件也明顯地看到,科技系統高度連結,一旦一間公司發生技術故障,就有可能在全球經濟引發連鎖災難。