Categories
Internet

Causas caída de Facebook, Whatsapp e Instagram

De las muchas noticias que sucedieron ayer quizás la más comentada (en Twitter, sobre todo) fue la caída mundial de los servicios de Facebook, WhatsApp e Instagram. Este artículo es una explicación de cuales han sido las causas, o al menos de lo que se nos ha informado hasta ahora.

Por motivos de seguridad es probable que nunca se sepa qué fue exactamente lo que pasó, por tanto, la teoría que ha explicado tu cuñado de que un becario le dio a un botón para abajo, es una posible explicación.

Página no disponible y caída mundial

El 4 de octubre de 2021 Facebook y sus dos servicios adquiridos como WhatsApp e Instagram sufrieron una caída mundial. Parecía que iba a ser un buen día cuando de pronto al entrar en WhatsApp te aparecía un mensaje de Conectando… . Además facebook.com no respondía ni tampoco Instagram.

Si ocurre eso no hay que apagar el móvil o el ordenador, solo tienes que comprobar que tengas conexión a internet. Abres un navegador en el dispositivo y pones una página web. Si puedes navegar tu conexión está bien, por tanto, la única explicación razonable es que WhatsApp esté caído o el servicio que no responde tal como se muestra en la Fig 1.

facebook caida mundial
Figura 1. Problemas detectados en Facebook, fuente: https://downdetector.es/problemas/facebook/noticias/414854-problemas-con-facebook/

Lo que importa son las DNS

Las DNS (domain name server) es un enorme base de datos de direcciones IP que, igual que funciona similar a un listín telefónico, le dice a tu navegador o app a donde tiene que encaminarse para llegar a un lugar de internet. Un usuario escribe una dirección web, ejemplo domain.com, el navegador va a leer al listín de las DNS y busca esa dirección que tiene asignada una dirección IP, un servidor. Y ese servidor devuelve una respuesta que muestra el contenido tal como puede verse en la Fig. 2.

dns domain server
Figura 2. Cómo funcionan las DNS de manera sencilla

En este sentido la DNS 1.1.1.1 es una de las más utilizadas hoy en día y pertenece a CloudFlare. En la informática siempre hay un límite, en las DNS también. Es buena idea utilizar un servidor DNS que sea rápido, puesto que de ese modo nos ahorramos tiempo de espera. Además este DNA de CloudFlare tiene otras ventajas como seguridad, privacidad, evita bloqueos etc..

Puedes perfectamente no hacer nada en tu dispositivo y utilizar las DNS que te proporciona tu proveedor de servicios de internet. También puedes utilizar las de Google que son 8.8.8.8 y 8.8.4.4..

Por tanto, si una página no funciona muchas veces es porque las DNS están caídas o no localizan tu página porque no la tienen en su listado. Siempre suele ser lo primero que se comprueba cuando algo falla. E Internet si algo tiene es que está en un continuo estado de error y solución, montaje y desmontaje. Es como si siempre se estuviera rompiendo y volvieron a repararse.

Cloudflare comparte lo que se sabe de la caída mundial de Facebook

Cloudflare es un servicio de seguridad de Internet y de servidores de nombres de dominio que se utiliza para proteger tu página web contra ataques DDoS o similares. Es como un filtro que pones antes de tu página web para filtrar el contenido que llega a ella.

En su foro han explicado las posibles causas de lo que ha ocurrido. La caída comenzó a las 1651 UTC en donde abrieron un incidente interno debido a que la búsqueda de DNA de Facebook devolvía SERVFAIL, fallo del servidor. ¿Es posible que Facebook esté caído? Revisaron el solucionador de DNA 1.1.1.1, pero se dieron cuenta que algo más serio estaba ocurriendo.

Las redes sociales entraron en erupción, información que sus ingenieros confirmaron rápidamente. No solo Facebook estaba caído, sino que sus servicios WhatsApp e Instagram estaban caídos también. Sus nombres DNS dejaron de resolverse y sus IP de infraestructura parecía que había desaparecido. Era como si en los servidores de Facebook hubiera habido un apagón general y se hubieran desconectado de la red.

Conociendo a BGP

BGP son las siglas de Border Gateway Protocol. Es un mecanismo para intercambiar información de enrutamiento entre sistemas autónomos (AS) en Internet. Los grandes enrutadores que hacen que Internet funcione tienen listas enormes y constantemente actualizadas de las posibles rutas que se pueden utilizar para entregar cada paquete de red a sus destinos finales. Es decir, los servidores de Facebook pueden cambiar de IPs pero los enrutadores actualizan su listado y vuelven a canalizar la petición de un usuario hasta un servidor válido.

Sin BGP, los enrutadores de Internet no sabrían qué hacer e Internet no funcionaría. Internet es literalmente una red de redes, como una red de miles de cables, y está unida por BGP. BGP permite que una red (digamos Facebook) anuncie su presencia a otras redes que forman Internet. Lo que ocurrió el 4 de octubre es que Facebook no anunciaba su presencia, los ISP (proveedor de servicios de Internet) y otras redes no podían encontrar la red de Facebook y, por lo tanto, no estaba disponible.

Conociendo a ASN

Cada una de las redes tiene un ASN: un número de sistema autónomo. Un sistema autónomo (AS) es una red individual con una política de enrutamiento interna unificada. Un AS puede originar prefijos (digamos que controlan un grupo de direcciones IP), así como prefijos de tránsito (digamos que saben cómo llegar a grupos específicos de direcciones IP).

La página web PeeringDB se creó para facilitar la interconexión entre redes y coordinadores de interconexión. Una base de datos ya no es solo para mirar e información relacionada. Ahora incluye todos los tipos de datos de interconexión para redes, nubes, servicios y empresas, así como las instalaciones de interconexión que se están desarrollando en el borde de Internet. El ASN de Facebook es 63293 según puede verse en https://www.peeringdb.com/net/14490.

Cada ASN necesita anunciar sus rutas de prefijo a Internet usando BGP; de lo contrario, nadie sabrá cómo conectarse y dónde encontrarnos. Es decir, sus datos tienen que enviarse a una base de datos para que el resto de los enrutadores conozcan a donde tienen que ir.

Resumen

Los eventos que han ocurrido el 4 de octubre de 2021 con la caída mundial de Facebook, Instagram y WhatsApp, es un recordatorio de la antifragilidad de Internet. La antifragilidad es una propiedad de Internet que significa que no todas las cosas pueden estar funcionando a la perfección todo el tiempo, sino que Internet se encuentra en un continuo estado de montaje y desmontaje. Y esta caída mundial es una demostración de esta propiedad de Internet.

Es un recordatorio de que internet es un sistema muy complejo e interdependiente de millones de sistemas y protocolos que trabajan juntos. Todos esos sistemas permiten que 5000 millones de usuarios se conecten a internet cada día y naveguen por Internet.

El incidente se resolvió alrededor de las 21:00 UTC, en el cual hubo una actividad renovada de BGP de la red de Facebook que alcanzó su punto máximo a las 21:17 UTC. Por tanto, la red de Facebook dejó de estar disponible entre las 15:50 UTC hasta las 21:20 UTC, en donde las DNS volvieron a funcionar y Facebook volvió al estado de montaje de nuevo.

Leave a Reply