Globalt AWS-nedbrud forårsager massive hjemmeside-, app- og betalingsafbrydelser

  • Fejl i US-EAST-1 (Nordlige Virginia) forårsager fejl og latenstid i flere AWS-tjenester.
  • Hændelser registreret mellem kl. 08:40 og 09:00 (halvøtid) og bekræftet af Amazon kort efter.
  • Vigtigste berørte platforme: Alexa, Prime Video, Fortnite, Roblox, Canva, Duolingo, Reddit, blandt andre.
  • AWS diskuterer tegn på genopretning og anbefaler at forsøge handlingerne igen; afhjælper et DNS-problem relateret til DynamoDB.

Afbrydelse af AWS Cloud-tjenesten

En bred afbrydelse i Amazon Web Services (AWS) Virussen har i morges forårsaget omfattende fejl i snesevis af applikationer, websteder og digitale tjenester verden over. De første advarsler er blevet registreret. fra 08:40-09:00 (halvøtid), med særlig indvirkning på tjenester, der er afhængige af US-EAST-1-regionen.

Faldet er ikke begrænset til et enkelt produkt: det spænder fra stemmeassistenter og streaming til produktivitetsværktøjer, sociale netværk og videospil. I Spanien er der også rapporteret om hændelser i kortbetalinger og Bizum, sammen med problemer med datatelefoner og nogle hæveautomater, en konsekvens der har fået mange virksomheder til midlertidigt at ty til kontanter.

Hvad sker der lige nu

Amazon har i sit statuspanel anerkendt en unormal stigning i fejl og latenser i forskellige tjenester, der tilbydes i regionen US-ØST-1 (Nordlige Virginia)Virksomheden forsikrer, at dens tekniske teams arbejder på at genoprette normaliteten, og at efterhånden som timerne går, der observeres betydelige tegn på bedring i de fleste anmodninger.

I løbet af morgenen har der været flere opdateringer: først blev hændelsen bekræftet (minutter efter kl. 09:00), derefter blev det meddelt, at De fleste operationer burde starte behandlingen uden problemer, og det blev senere indikeret, at problemernes oprindelse var knyttet til DNS-opløsningen tilknyttet DynamoDBAt afbøde dette punkt har forbedret situationen, selvom der stadig kan forekomme resterende fejl.

For dem, der fortsat oplever fejl, når de opretter forbindelse til bestemte tjenester, har AWS anbefalet anmodninger om nye forsøg og i specifikke tilfælde tømme DNS-cachen, især hvis problemerne fortsætter med DynamoDB-slutpunkter i den berørte region.

Rapporter fra platforme til sporing af hændelser har vist en vedvarende fald i rapporter efterhånden som middagen skred frem, hvilket peger på en gradvis og faseopdelt genopretning afhængigt af tjenesten og placeringen.

Tjenester berørt af AWS-nedbruddet

Tjenester og platforme med hændelser

Udvalget af berørte tjenester er bredt og heterogent. Blandt de mest nævnte af brugere og virksomheder er Alexa og Prime Video. Amazonas økosystem, samt flere tredjepartsapplikationer, der er afhængige af AWS-infrastrukturen.

  • underholdning og spilFortnite, Roblox, Clash Royale, PUBG, Rainbow Six Siege, Crunchyroll og Prime Video har rapporteret forbindelsesfejl og periodiske afbrydelser.
  • Produktivitet og skabelseCanva, Duolingo, Trello, Slack, Zoom og Dropbox har vist ustabil adgang og høje responstider.
  • Netværk og beskederReddit og Snapchat har indsamlet rapporter om indlæsningsfejl og midlertidige blokeringer.
  • AI og assistenterForvirring og Alexa-aktiverede enheder og Amazon Generative AIOg kameraer og dørklokker af Ring-økosystemet, har oplevet funktionsnedbrud.
  • Betalinger og handelhændelser i datafoner, bizum og nogle gateways har tvunget til at suspendere specifikke operationer; Ticketmaster Det forsinkede endda billetsalget, såsom dem der var planlagt til La Oreja de Van Gogh.

Globalt omfang af hændelsen i AWS

Hvor det har været mest mærkbart, og hvorfor det påvirker folk uden for USA.

Hændelserne har været koncentreret på USA's østkyst (med toppe i New York, Los Angeles, San Francisco og Seattle), men der er også rapporteret om problemer i Storbritannien (London og Manchester) og flere europæiske lande. Selvom epicentret ligger i US-EAST-1, er mange globale tjenester afhængige af denne region for kritiske dele af deres operationer.

I praksis betyder det, at nogle applikationer De forbliver tilgængelige, men med begrænsede funktionereller ikke opdaterer indhold i realtid. Denne distribuerede arkitektur forklarer, hvorfor en lokaliseret fejl kan have en dominoeffekt på andre regioner, selv når europæiske eller asiatiske datacentre forbliver i drift.

Vejledende kronologi over hændelsen

• Blandt de 08 og 40 (halvøtid) opstår de første toppe af rapporter. • Omkring 09:30AWS bekræfter problemer, der øge fejlrater og latenstider i forskellige tjenester. • Rundt om 11:00Amazon angiver, at de har identificeret den mulige årsag og arbejder på at afbøde den. • Efter 11:30, kommunikerer tydelige tegn på bedring• Ved middagstid falder rapporterne, og de fleste tjenester bliver gradvist genoprettet.

Alligevel advarer virksomheden om potentiel resterende hændelser i visse operationer og anbefaler nye forsøg, indtil normaliteten er fuldendt på alle fronter.

Hvordan det påvirker dig, og hvad du kan gøre

Hvis du bemærker, at en hjemmeside ikke indlæses, Alexa svarer ikkeHvis et onlinespil ikke opretter forbindelse, eller en arbejdsapp oplever problemer, er det sandsynligt, at tjenesten er afhængig af AWS og er i genoprettelsesfasen. I disse tilfælde, Genstart af routere eller enheder hjælper normalt ikke.Det mest effektive er at vente og prøve igen senere.

I professionelle miljøer er det tilrådeligt at planlægge kritiske opgaver med margin og, hvis det er muligt, aktiver genforsøg og timeouts mere generøs i integrationer, der afhænger af AWS-slutpunkter. I meget specifikke scenarier, tømning af DNS-cache kan fremskynde genoprettelsen af ​​forbindelsen til visse tjenester, der allerede er genoprettet.

En påmindelse om cloud-afhængighed

Med en markedsandel på over 30% Globalt set er AWS rygraden i tusindvis af digitale virksomheder. Når en hændelse rammer en nøgleregion som USA-ØST-I, chokbølgen Det er tydeligt i applikationer, der bruges dagligt af millioner af mennesker, fra streaming og spil til bankvirksomhed og e-handel.

Dagens episode sætter behovet for igen på dagsordenen robuste arkitekturer (multiregion, flerlags og med kontrolleret nedbrydning), ud over klare kommunikationsstrategier til at håndtere bruger- og kundeforventninger når der opstår større afbrydelser.

Efter flere timers afbødende arbejde fra Amazon peger situationen på en gradvis genopretning i de fleste tjenester, med synlige forbedringer i adgang og latenstid. Der kan stadig være små stød, men tendensen er positiv, og alt tyder på, at trafikken vender tilbage til normalen i nogle strækninger, efterhånden som justeringerne er færdiggjort i det berørte område.

Amazon generative AI-arbejdere
relateret artikel:
Amazon Generative AI: Sådan opretter du originalt indhold med AI