W drugiej połowie października 2025 roku doszło do jednej z największych awarii w historii usług chmurowych Amazon AWS Web Services. Wydarzenie to pokazało, jak silnie globalna gospodarka cyfrowa uzależniła się od jednego dostawcy infrastruktury oraz jak krucha potrafi być stabilność internetu opartego na centralnych systemach chmurowych.
🟨 PostgreSQL Online: Jak efektywnie pracować z bazami danych w chmurze
Skala i przebieg awarii
Do awarii doszło w regionie US-EAST-1 w Północnej Wirginii – najstarszym i największym centrum danych Amazona, stanowiącym kluczowy węzeł dla wielu globalnych aplikacji. Problem rozpoczął się podczas rutynowej aktualizacji API w usłudze DynamoDB, wykorzystywanej do przechowywania informacji o użytkownikach.
W wyniku błędu w bazie danych systemu nazw domen (DNS) serwery przestały poprawnie rozpoznawać adresy usług. Z pozoru niewielki błąd wywołał efekt domina – aplikacje nie mogły odnaleźć właściwych serwerów, co doprowadziło do przeciążenia systemów kierujących ruchem sieciowym. W rezultacie znacząca część infrastruktury Amazon AWS straciła zdolność komunikacji wewnętrznej, a to sparaliżowało tysiące zależnych od niej usług.

Globalne skutki i straty
Awaria objęła swoim zasięgiem niemal cały świat. Według danych z serwisu Downdetector, zarejestrowano ponad 16 milionów zgłoszeń problemów z dostępem do usług. Szacuje się, że ponad 2000 aplikacji w 60 krajach przestało działać lub działało z poważnymi opóźnieniami. Straty finansowe liczono w miliardach dolarów.
Nie działały najpopularniejsze platformy internetowe:
- Amazon, Reddit, Canva, Snapchat, Duolingo
- ChatGPT, Perplexity i inne systemy oparte na AI
- Gry online, w tym Fortnite, Roblox, Pokemon Go
- Aplikacje bankowe i giełdy kryptowalut, takie jak Coinbase
- Systemy rezerwacji, strony rządowe i serwisy streamingowe
Awaria dotknęła także segmentu Internetu Rzeczy (IoT) – tysiące urządzeń smart home, od robotów sprzątających po inteligentne materace, przestały funkcjonować bez dostępu do serwerów w chmurze.
Przyczyny i czynniki ryzyka – Amazon AWS
Choć oficjalne raporty wskazują na błąd aktualizacji, eksperci zwracają uwagę na szerszy kontekst. Centralizacja infrastruktury chmurowej powoduje, że nawet pojedynczy incydent w jednym centrum danych może wywołać skutki o globalnym zasięgu.
Pojawiły się również doniesienia, że redukcje etatów w Amazonie mogły pośrednio przyczynić się do problemu. W lipcu 2025 roku firma zwolniła setki pracowników działu chmurowego, częściowo zastępując ich systemami AI do zarządzania infrastrukturą. Zastąpienie doświadczonych inżynierów algorytmami mogło utrudnić szybką reakcję w sytuacji kryzysowej.

Reakcja Amazona i branży chmurowej
Po ustabilizowaniu sytuacji Amazon zapowiedział reorganizację zespołów odpowiedzialnych za automatyzację oraz intensyfikację testów z wykorzystaniem sztucznej inteligencji. Celem jest wcześniejsze wykrywanie błędów i symulowanie ich skutków przed wdrożeniem aktualizacji na produkcji.
W branży coraz częściej mówi się również o strategii multi-cloud, czyli dywersyfikacji infrastruktury poprzez korzystanie z kilku dostawców jednocześnie. Ma to zmniejszyć ryzyko całkowitego przestoju w przypadku awarii jednego dostawcy. Na znaczeniu zyskują także mniejsi gracze, tacy jak IBM Cloud, Alibaba Cloud czy Stackit z Europy.
Szerszy wymiar i wnioski – Amazon AWS
Wydarzenie to stało się punktem odniesienia w dyskusji o cyfrowej suwerenności i potencjalnych konsekwencjach zbyt dużej koncentracji mocy obliczeniowej w rękach kilku korporacji. Analitycy ostrzegają, że awarie tej skali mogą mieć w przyszłości nie tylko skutki gospodarcze, ale i geopolityczne.
Zależność od amerykańskich centrów danych (AWS, Azure, Google Cloud) sprawia, że infrastruktura cyfrowa wielu państw staje się podatna na decyzje polityczne lub handlowe podejmowane poza ich granicami.

Podsumowanie – Amazon AWS
Globalna awaria AWS z października 2025 roku unaoczniła, jak cienka granica dzieli stabilny ekosystem chmurowy od globalnego paraliżu sieci. Pokazała również, że nawet najbardziej zaawansowane systemy zabezpieczeń nie gwarantują pełnej odporności, gdy decydujące procesy koncentrują się w jednym punkcie.
Dla firm i instytucji to wyraźny sygnał, że strategia multi-cloud i plan awaryjny powinny stać się standardem, a nie opcją. Dla użytkowników – przypomnienie, że nawet najbardziej oczywiste usługi w internecie nie są niezawodne.


