00:00:00¿Sabías que internet está infectado de zombis? No, no de esa clase de zombis.
00:00:05De los que hablo se llaman zombis BGP. BGP son las siglas de Border Gateway Protocol
00:00:12y es el sistema que usan las grandes redes para anunciar a qué direcciones IP pueden entregar tráfico.
00:00:18Internet está conectado por este enorme mapa global que indica a las redes cómo llegar unas a otras
00:00:24y todo esto se gestiona a través del sistema BGP. Por lo general,
00:00:29este sistema funciona sin problemas, pero a veces aparecen zombis inesperados.
00:00:35¿Pero por qué ocurre eso? Bueno, eso es lo que vamos a descubrir en el video de hoy.
00:00:39En el sistema BGP, cuando una red quiere que el tráfico llegue a una nueva ubicación,
00:00:49anuncia una ruta. Cuando quiere que el tráfico deje de pasar por una ubicación antigua,
00:00:54retira esa ruta. Esto ocurre constantemente. Las redes mueven el tráfico entre centros de datos,
00:01:00trasladan clientes a nuevos nodos o desconectan servidores para mantenimiento.
00:01:04Retirar una ruta es simplemente la forma de decirle al resto del mundo que ese camino ya no es válido.
00:01:09Pero a veces sucede algo extraño. Se retira una ruta,
00:01:13y aun así algunas redes siguen creyendo que todavía existe. Continúan enviando tráfico por una ruta que
00:01:20debería haber desaparecido. Esto es lo que se llama un zombi BGP. Es una ruta obsoleta que se niega a desaparecer
00:01:26de la tabla de enrutamiento global, aunque la red que la creó ya la haya eliminado.
00:01:32Entonces, ¿qué pasa con el tráfico mientras este zombi sigue vivo? Pues que no llega a su destino.
00:01:38Puede buclear entre routers un momento antes de descartarse. También puede dar un largo rodeo
00:01:43por varias redes hasta llegar a un callejón sin salida. O puede caer en una red que intente
00:01:49reenviarlo pero que no consiga entregarlo en ningún sitio útil. Desde la perspectiva del usuario,
00:01:55esto se traduce en una página que no carga o da error de tiempo de espera, o una app que no conecta.
00:02:01A veces es casi imperceptible, pero en otras ocasiones la lentitud es muy evidente.
00:02:06La siguiente pregunta lógica es por qué los routers no actualizan el mapa global de inmediato.
00:02:11La respuesta reside en cómo procesa el BGP los cambios. Cuando desaparece una ruta específica,
00:02:17los routers buscan una alternativa menos específica. Esa búsqueda lleva tiempo. En ese intervalo,
00:02:23algunos routers no logran borrar la entrada antigua y se quedan con información obsoleta. Cloudflare
00:02:29observó que estos zombis duraban entre 6 y 11 minutos en redes grandes.
00:02:34Los zombis de IPv4 tendían a sobrevivir incluso más que los de IPv6. Pero, con el tiempo,
00:02:40el sistema se corrige solo porque cada ruta en BGP tiene un temporizador. Si un router no
00:02:46recibe actualizaciones recientes en un tiempo, elimina la ruta automáticamente. Incluso si un router
00:02:52pasa por alto la retirada inicial, el intercambio constante de datos BGP con sus vecinos acabará
00:02:57informándole de que la ruta ya no existe. Cuando suficientes routers coinciden en el nuevo estado,
00:03:03el zombi desaparece. Cloudflare descubrió este comportamiento trabajando con clientes de BYOIP
00:03:09o “Trae tu propia IP”. En estos casos, Cloudflare anuncia temporalmente el espacio de IP de un cliente
00:03:15y luego lo retira tras el traspaso. Se supone que la retirada debería ser limpia,
00:03:21pero vieron que a veces algunos proveedores seguían usando la ruta antigua mucho después de eliminada.
00:03:27Ese desfase hacía que el tráfico tomara rutas inesperadas e ineficientes hacia la red de Cloudflare.
00:03:33Para solucionar el problema, Cloudflare introdujo un método más seguro. En lugar de retirar
00:03:38la ruta antigua de golpe, primero anuncian la misma ruta desde una ubicación estable. Eso obliga
00:03:45a los routers de todo el mundo a cambiar limpiamente a la nueva versión. Solo entonces retiran
00:03:50el anuncio antiguo. Esto evita el fallo en cascada que crea los zombis. Además, Cloudflare
00:03:56ajustó sus sistemas internos para que las transiciones sean más fluidas en el futuro. Si quieres
00:04:02leer más sobre el tema, Cloudflare publicó una entrada de blog muy detallada explicando el problema.
00:04:07En conclusión, es un recordatorio de que incluso las partes más básicas de internet pueden fallar
00:04:13inesperadamente bajo ciertas condiciones. Aun así, la mayoría de las veces estos problemas se resuelven
00:04:19antes de que los usuarios noten nada. Pero a veces aparecen zombis. Internet se mantiene unido por millones
00:04:25de decisiones de enrutamiento cada segundo. Y sorpresas como los zombis BGP demuestran cuánta
00:04:31coordinación hace falta para que todo funcione bien. Eso es básicamente todo. Ahora
00:04:37ya sabes qué son los zombis BGP. La próxima vez que algo tarde en cargar o falle, puede que
00:04:43te hayas topado con un zombi en internet. Si te gustan estos análisis técnicos, no olvides
00:04:48darle al botón de like debajo del video. Y asegúrate de suscribirte a nuestro canal. Soy
00:04:53Andris de Better Stack y nos vemos en los próximos videos.