'Dit alles gebeurde heel snel': hoe een routinegebeurtenis alles op Facebook ten val bracht

0
124

Liam Tung

Door Liam Tung | 6 oktober 2021 | Onderwerp: Productiviteit

Je kon WhatsApp of Instagram niet gebruiken omdat de datacenters van Facebook volledig waren afgesloten nadat een schijnbaar alledaagse gebeurtenis een catastrofale storing veroorzaakte.

Facebook's urenlange storing op zondag was een grimmige herinnering aan hoe afhankelijk mensen zijn geworden van de datacenters van één bedrijf die 's werelds grootste sociale netwerken van stroom voorzien.

Zoals Steven J. Vaughan-Nichols van ZDNet deze week meldde, functioneerden de servers van Facebook voor zijn internetadresboek – een Domain Name Server (DNS) – niet, waardoor Facebook, WhatsApp en Instagram om redenen niet beschikbaar waren dat de meeste van de twee miljard gebruikers niet zullen begrijpen.

Facebook's DNS was kapot omdat Border Gateway Protocol (BGP)-routes naar Facebook-sites faalden. DNS vertaalt woorden als 'Google' in numerieke internet- of IP-adressen, die BGP 'adverteert' op internet, waardoor pc's en smartphones verbinding kunnen maken met websites.

De socialemediagigant heeft nu een gedetailleerder verslag gegeven van wat ervoor zorgde dat 's werelds grootste berichtensysteem op zondag urenlang verdween. Het incident laat zien hoe Facebook zelf een storingspunt is geworden voor wereldwijde berichten.

Het incident zelf heeft echter een saaie verklaring. De labyrintische netwerken van Facebook kraakten omdat een “routinematige” onderhoudstaak misging op een manier waar de netwerken en datacenters niet voor waren gebouwd. Het veroorzaakte uiteindelijk een “volledige ontkoppeling” tussen Facebook-datacenters en internet, waardoor Facebook, WhatsApp en Instagram ontoegankelijk werden.

“Deze storing werd veroorzaakt door het systeem dat onze wereldwijde backbone-netwerkcapaciteit beheert”, legt Santosh Janardhan, vice-president engineering bij Facebook uit in een blogpost met de titel “Meer details over de storing op 4 oktober”.

“De ruggengraat is het netwerk dat Facebook heeft gebouwd om al onze computerfaciliteiten met elkaar te verbinden, dat bestaat uit tienduizenden kilometers glasvezelkabels die de wereld oversteken en al onze datacenters met elkaar verbinden”, vervolgde hij. .

“Dit was de oorzaak van de storing van gisteren. Tijdens een van deze routine-onderhoudstaken werd een opdracht gegeven met de bedoeling om de beschikbaarheid van wereldwijde backbone-capaciteit te beoordelen, waardoor onbedoeld alle verbindingen in ons backbone-netwerk werden verbroken, waardoor Facebook-datacenters effectief werden losgekoppeld globally.”.

De storing onthulde hoe afhankelijk mensen zijn van de betrouwbaarheid van de infrastructuur van Facebook en volgt de inspanningen om WhatsApp, Facebook Messenger en Instagram-berichten samen te voegen.

Het gebeurde ook toen Facebook werd onderzocht tijdens een onderzoek van de Senaat over ethiek en de behandeling van verkeerde informatie op zijn platforms, die volgde op een lek van interne documenten die vorige maand door de Wall Street Journal werden gepubliceerd en die onder meer onthulden dat Facebook wist dat Instagram lichaamsbeeld maakte problemen erger voor een op de drie tienermeisjes.

Janardhan onthulde dat de infrastructuur van Facebook niet was toegerust om de snelheid van de gebeurtenissen aan te kunnen.

“Dit is allemaal heel snel gegaan”, geeft hij toe.

“Om een ​​betrouwbare werking te garanderen, schakelen onze DNS-servers die BGP-advertenties uit als ze zelf niet met onze datacenters kunnen praten, omdat dit een indicatie is van een ongezonde netwerkverbinding”, legt hij uit.

“Bij de recente storing is de volledige backbone uit bedrijf genomen, waardoor deze locaties zichzelf ongezond verklaarden en die BGP-advertenties introkken. Het eindresultaat was dat onze DNS-servers onbereikbaar werden, terwijl ze nog steeds operationeel waren. maakte het voor de rest van het internet onmogelijk om onze servers te vinden.”

Gerelateerde onderwerpen:

Smart Office CXO MKB Tech Industry Enterprise Software Liam Tung

Door Liam Tung | 6 oktober 2021 | Onderwerp: Productiviteit