00:00:00Você sabia que a internet está infestada de zumbis? Não, não esse tipo de zumbi.
00:00:05Os que eu estou falando são chamados de zumbis de BGP. BGP significa Border Gateway Protocol
00:00:12e é a forma como as grandes redes anunciam para quais endereços IP elas podem entregar tráfego.
00:00:18A internet é conectada por este enorme mapa global que diz às redes como alcançar umas às outras
00:00:24e tudo isso é mantido através do sistema BGP. Na maioria das vezes,
00:00:29esse sistema funciona perfeitamente, mas às vezes zumbis inesperados aparecem no sistema.
00:00:35Mas por que isso acontece? Bem, é o que vamos descobrir no vídeo de hoje.
00:00:39No sistema BGP, quando uma rede quer que o tráfego chegue a um novo local,
00:00:49ela anuncia uma rota. Quando quer que o tráfego pare de vir por um local antigo,
00:00:54ela retira essa rota. Isso acontece o tempo todo. As redes movem tráfego entre data centers,
00:01:00migram clientes para novas bordas ou retiram servidores do ar para manutenção.
00:01:04Retirar uma rota é simplesmente como elas dizem ao resto do mundo que aquele caminho não é mais válido.
00:01:09Mas às vezes algo estranho acontece. Uma rota é retirada,
00:01:13mas algumas redes continuam acreditando que ela ainda existe. Elas continuam enviando tráfego por um caminho que
00:01:20deveria ter sumido. E isso é chamado de zumbi de BGP. É uma rota obsoleta que se recusa a desaparecer
00:01:26da tabela de roteamento global, mesmo que a rede que a criou já a tenha removido.
00:01:32Então, o que acontece com o tráfego enquanto esse zumbi está vivo? Ele não chega ao destino. Ele
00:01:38pode ficar em loop entre roteadores por um momento antes de ser descartado. Pode também dar uma volta enorme
00:01:43por várias redes até chegar a um beco sem saída. Ou pode cair em uma rede que tenta
00:01:49encaminhá-lo, mas ainda assim não consegue entregá-lo a lugar nenhum útil. Na perspectiva do usuário, isso pode
00:01:55resultar em uma página travada, erro de tempo esgotado ou um app que não conecta por um curto período.
00:02:01Às vezes é quase imperceptível. Mas em outras vezes a lentidão é bem visível.
00:02:06A próxima pergunta lógica é por que os roteadores falham ao atualizar o mapa global imediatamente.
00:02:11A resposta está em como o BGP processa as mudanças. Quando uma rota mais específica desaparece,
00:02:17os roteadores buscam uma alternativa menos específica. Essa busca leva tempo. Durante essa janela,
00:02:23alguns roteadores falham em limpar a entrada antiga. Eles ficam presos a informações desatualizadas. A Cloudflare
00:02:29observou que esses zumbis duravam entre 6 e 11 minutos em redes de grande porte.
00:02:34Zumbis de IPv4 tendiam a sobreviver ainda mais do que os de IPv6. Mas, eventualmente,
00:02:40o sistema se corrige porque toda rota no BGP tem um temporizador. Se um roteador não
00:02:46recebe atualizações recentes por um tempo, ele deleta a rota automaticamente. Mesmo que um roteador perca
00:02:52a retirada da rota na primeira vez, a comunicação constante de BGP com seus vizinhos acabará
00:02:57informando que a rota sumiu. Quando roteadores vizinhos suficientes concordam com o novo estado,
00:03:03o zumbi desaparece. A Cloudflare descobriu esse comportamento ao trabalhar com clientes de BYOIP ou
00:03:09“Bring Your Own IP”. Nessas situações, a Cloudflare anuncia temporariamente o espaço de IP do cliente
00:03:15e depois o retira após a transferência. A retirada em si deveria ser limpa,
00:03:21mas eles viram que, às vezes, alguns provedores continuam usando a rota antiga muito depois dela ter
00:03:27sido removida. Esse descompasso fazia o tráfego seguir caminhos inesperados e ineficientes para a rede da Cloudflare.
00:03:33Para corrigir o problema, a Cloudflare introduziu um método mais seguro. Em vez de retirar a rota antiga
00:03:38diretamente, eles primeiro anunciam a mesma rota de um local estável. Isso força os roteadores
00:03:45ao redor do mundo a mudar de forma limpa para a nova versão. Só então eles retiram o anúncio
00:03:50antigo. Isso evita a busca por alternativas que causa os zumbis. A Cloudflare também
00:03:56ajustou seus sistemas internos para que as transições ocorram de forma mais suave no futuro. Se você quiser
00:04:02ler mais sobre este tópico, a Cloudflare publicou um post detalhado em seu blog explicando o problema.
00:04:07Concluindo, isso serve como um lembrete de que mesmo as partes fundamentais da internet podem se comportar
00:04:13de forma inesperada sob certas condições. E ainda assim, na maioria das vezes, esses problemas são resolvidos antes
00:04:19que os usuários percebam. Mas às vezes zumbis podem aparecer. A internet é mantida por milhões
00:04:25de decisões de roteamento acontecendo a cada segundo. E surpresas ocasionais como os zumbis de BGP mostram quanta
00:04:31coordenação é necessária para manter tudo funcionando. Então é basicamente isso. Agora
00:04:37você já sabe o que são zumbis de BGP. Da próxima vez que algo travar ou falhar ao carregar, você pode
00:04:43ter acabado de encontrar um zumbi na internet. Se você gosta de análises técnicas assim, não esqueça de
00:04:48clicar no botão de gostei abaixo do vídeo. E inscreva-se no nosso canal. Aqui é o Andris da Better Stack
00:04:53e vejo você nos próximos vídeos.