پس از تشدید درگیریها در منطقه، بخشی از زیرساختهای ابری آمازون در امارات متحده عربی و بحرین هدف حملات پهپادی قرار گرفت؛ حملاتی که برخلاف قطعیهای مرسوم کلود، اینبار مستقیماً لایه فیزیکی دیتاسنترها را درگیر کرده است. بر اساس گزارشها، حداقل سه دیتاسنتر در این دو کشور آسیب دیدهاند و همین موضوع باعث شده بازیابی کامل سرویسها وارد فاز چندماهه شود.
طبق جزئیاتی که Ars Technica منتشر کرده، آسیبها صرفاً به سطح شبکه یا نرمافزار محدود نبوده و شامل اختلال در چند لایه کلیدی زیرساختی است.
خسارات سختافزاری و زیرساختی
این خسارات شامل از کار افتادن بخشی از رکهای سرور، آسیب به سیستمهای توزیع برق، اختلال در تجهیزات خنکسازی (HVAC) و در برخی موارد، خسارت ثانویهای است که به علت فعال شدن سیستمهای اطفای حریق، منجر به آبگرفتگی در سالنهای سرور شده است.
این نوع آسیبها عملاً نیازمند تعویض سختافزار، بازآرایی رکها و حتی بازسازی بخشی از فضای دیتاسنتر هستند.
خسارت بخش نرمافزار و خدمات
در سطح سرویس، این اتفاق به کاهش ظرفیت عملیاتی یک Region و اختلال در سرویسهای حیاتی AWS منجر شده است. سرویسهایی مانند EC2 (ماشینهای مجازی)، S3 (ذخیرهسازی آبجکت) و DynamoDB در این منطقه با latency بالا، قطعی مقطعی یا در برخی موارد عدم دسترسی کامل مواجه شدهاند.
همچنین گزارش دیگری از Reuters نشان میدهد که حتی هفتهها پس از حادثه، دهها سرویس همچنان در وضعیت degraded (تقلیل ظرفیت و خدمات توسط سرویسدهنده) باقی ماندهاند؛ موضوعی که نشان میدهد بخشی از Availability Zoneها عملاً از مدار خارج شدهاند.

واکنش آمازون به خسارات و زمان بازگشت
آمازون در اطلاعرسانی به مشتریان تأکید کرده که بازگشت کامل ظرفیت به حالت پایدار «چند ماه» زمان خواهد برد. این شرکت بهطور رسمی توصیه کرده workloadها به Regionهای دیگر منتقل شوند و از بکاپهای خارج از منطقه برای بازیابی داده استفاده شود.
به زبان ساده، این یعنی آمازون در این منطقه فعلاً نمیتواند همان سطح پایداری و اطمینانی را که معمولاً از AWS انتظار میرود، ارائه دهد. در شرایط عادی، زیرساختهای AWS طوری طراحی شدهاند که حتی اگر بخشی از سیستم (مثلاً یک دیتاسنتر یا Availability Zone) دچار مشکل شود، سرویس بدون اختلال جدی از طریق بخشهای دیگر ادامه پیدا کند.
وقتی آسیب بهصورت فیزیکی و همزمان چند بخش از یک Region را درگیر میکند، این سازوکارهای جبرانی هم کارایی کامل خود را از دست میدهند. به همین دلیل، آمازون به مشتریان توصیه کرده سرویسها و دادههایشان را به مناطق دیگر منتقل کنند، چون در وضعیت فعلی نمیتواند تضمین کند که سرویسها در همین Region با همان سطح همیشگی از دسترسپذیری و پایداری اجرا شوند.
میزان خسارت مالی به سرورهای آمازون
در خصوص خسارت مالی، عدد رسمی منتشر نشده، اما برآوردهای اولیه رقم حدود ۱۵۰ میلیون دلار را مطرح میکنند. البته برخی منابع غیررسمی اعداد بسیار بزرگی را برای خسارات آمازون مطرح کردهاند که تا کنون هیچ فرد یا واحدی در AWS آنها را تایید نکرده است.
نکته مهمی که باید در این زمینه مد نظر قرار گیرد این است که بخش قابل توجهی از هزینه واقعی، نه صرفاً به تعمیر تجهیزات، بلکه به از دست رفتن ظرفیت، جابهجایی بار کاری مشتریان و downtime سرویسها مربوط میشود.
در مجموع، این رویداد را نمیتوان یک اختلال معمول در سطح کلود دانست. وقتی چند Availability Zone در یک Region بهدلیل آسیب فیزیکی از دسترس خارج میشوند، حتی معماریهای مبتنی بر redundancy (فراوانی) داخلی همان Region هم کارایی خود را از دست میدهند.
به همین دلیل، این حادثه عملاً یکی از نادرترین سناریوها در معماری hyperscale را رقم زده؛ جایی که بازیابی نه با failover نرمافزاری، بلکه با بازسازی فیزیکی زیرساخت انجام میشود.













نظر خود را اضافه کنید.
برای ارسال نظر وارد شوید
ارسال نظر بدون عضویت در سایت