قطعی اخیر سرویسهای وب آمازون (AWS) که بخش قابل توجهی از اینترنت، بازیها و دستگاههای خانه هوشمند را برای روزها مختل کرد، ناشی از پیکربندی نادرست DNS برای DynamoDB بود. این مشکل که به اشتباه در Route53 منتشر شد، به سایر اجزای AWS مانند EC2 و متعادلکننده بار شبکه سرایت کرده و منجر به اختلالات گسترده خدمات شد. علت فنی این مشکل، یک “شرایط رقابتی” (race condition) در فرآیند اعمال و پاکسازی طرحهای DNS بود که به حذف ناخواسته ورودیهای DNS دیتابیس DynamoDB انجامید.
این حادثه نیاز به مداخله دستی و محدودسازی ایجاد نمونههای EC2 داشت. آمازون برای رفع مشکل، سرویسهای DNS Planner و Enactor را موقتاً متوقف کرده، تستهای جدیدی برای EC2 اضافه نموده و مکانیزمهای کنترلی متعادلکننده بار شبکه را بهبود میبخشد. این رویداد بر پیچیدگی سیستمهای ابری خودکار تأکید کرده و نیاز به برنامهنویسی دقیق و عدم تمرکز قوی برای قابلیت اطمینان زیرساخت ابری سازمانی را برجسته میسازد.
- کولبات
- آبان 2, 1404






