AWS障害復旧、世界中の企業が再始動へ

AWSのロゴと壊れたイーサネットケーブルが2025年10月20日に撮影されたイラストに見られます。(ロイター/ダド・ルヴィック/イラスト)

ロジスティクス業界の専門家がCOVID-19後に「前進」する計画

フィリピン人が韓国文化と製品を愛する理由

バタンガスが家族向けの予算に優しい休暇先である理由

AWSの障害が世界中の主要なウェブサイトとアプリに影響

問題は障害で知られる米国のサイトで発生

サービスは改善されたが、問題が再発し、その後回復

AWSの問題によりゲームや金融プラットフォームが影響を受ける

「多くのウェブサイトやアプリが暗転、アマゾンのクラウド部門が世界的な障害を報告」

それでも、アマゾンは「一部のAWSサービスにはメッセージのバックログがあり、処理に数時間かかる」と述べました。

過去5年間で少なくとも3回、AWSの北バージニアクラスター(US-EAST-1として知られる)が主要なインターネット障害に寄与しました。

アマゾンは、その特定のデータセンターがなぜ影響を受け続けるのかについての明確な説明を求める要求には応じませんでした。問題は、アプリケーションがAWSのDynamoDB APIの正しいアドレスを見つけることを妨げたドメインネームシステム(DNS)として知られるものに起因していました。このクラウドデータベースは、ユーザー情報やその他の重要なデータを保存するために依存されています。

根本原因はネットワークヘルスモニター

以前、AWSは障害の根本原因がネットワーク負荷分散装置のヘルスを監視する基盤サブシステムにあると述べました。

問題は、AWSの「Elastic Compute Cloud」サービスである「EC2内部ネットワーク」内から発生したとアマゾンは述べました。このサービスはAWS内でオンデマンドのクラウド容量を提供します。

太平洋時間午後3時過ぎ(2200 GMT)、アマゾンは「すべてのAWSサービスが通常の運用に戻った」と述べました。「AWS Config、Redshift、Connectなどの一部のサービスは、今後数時間で処理を完了するメッセージのバックログを持ち続ける」としています。

コーネル大学のコンピュータサイエンス教授であるケン・バーマン氏は、ソフトウェア開発者はより良いフォールトトレランスを構築する必要があると述べました。彼は、AWSは開発者が問題発生時に自分自身を保護するために使用できるツールを提供しており、開発者は他のクラウドプロバイダーとバックアップを作成することもできると述べました。

「人々がコストを削減し、アプリケーションを立ち上げようとして手抜きをし、最後のステップをスキップして本当に障害に対する保護をしなかったことを忘れると、そのような企業は後で本当に精査されるべきです」とバーマン氏はロイターに語りました。

以前の障害で知られるAWSサイトから問題が発生

AzureとアルファベットのGoogle Cloud。

そのサーバーへの障害は、食品配達アプリからゲームプラットフォーム、航空会社システムまで、クラウドインフラに依存するウェブサイトやプラットフォーム全体に障害を引き起こす可能性があります。

AWSはステータスページで、月曜日の障害はそのUS-EAST-1ロケーションで発生したと述べました。これはウェブサービスにおいて最も古く、最大のものです。このサイトは2021年と2020年にも障害を経験しました。

AWSのウェブサイトのドキュメントによれば、US-EAST-1サイトは多くのAWSサービスのデフォルト地域であることが多いです。

「脆弱なインフラ」

「この障害は、私たちが比較的脆弱なインフラに依存していることを再び浮き彫りにしました」と、欧州のサイバーセキュリティ企業ESETのグローバルサイバーセキュリティアドバイザーであるジェイク・ムーア氏は述べました。

英国では、ロイド銀行、スコットランド銀行、通信サービスプロバイダーのボーダフォンとBTがすべて影響を受けたと、ダウンディテクターの英国ウェブサイトによれば、英国税務、支払い、関税当局HMRCのウェブサイトも影響を受けました。

「この問題の主な理由は、これらの大企業がただ1つのサービスに依存していることです」と、サリー大学コンピュータサイエンス学科の研究ディレクターであるニシャンス・サストリ氏は述べました。

ダウンディテクターを所有するウクラは、このインシデントにより400万人以上のユーザーが問題を報告したと述べました。

スナップチャットからVenmoまで:障害がアプリを停止

ウクラは、少なくとも1000社がこの障害の影響を受けたと述べました。

Reddit、Roblox、スナップチャット、Duolingoがすべて影響を受けました。

人工知能スタートアップのPerplexity、暗号通貨取引所のCoinbase、取引アプリのRobinhoodもプラットフォームの混乱を経験し、それをAWSに起因させました。

アマゾン自身のサービス、ショッピングウェブサイト、プライムビデオ、Alexaも影響を受けました。

Epic Gamesが所有するFortnite、Clash Royale、Clash of Clansも影響を受けたゲームプラットフォームの一部です。UberのライバルであるLyftも米国で停止しました。

Signalの社長であるメレディス・ウィテカー氏は、メッセージングアプリが障害の影響を受けたことを確認しましたが、億万長者のイーロン・マスク氏が所有するプラットフォームは引き続き動作していると述べました。

【用語解説】

– AWS(アマゾン ウェブ サービス):アマゾンが提供するクラウドコンピューティングサービス。
– DNS(ドメインネームシステム):インターネット上でドメイン名とIPアドレスを対応付けるシステム。
– EC2(Elastic Compute Cloud):AWSが提供する仮想サーバーサービス。


オリジナルサイトで読む