A Internet está repleta de Zumbis e ninguém está falando sobre isso

BBetter Stack
Internet TechnologyComputing/Software

Transcript

00:00:00Você sabia que a internet está infestada de zumbis? Não, não esse tipo de zumbi.
00:00:05Os que eu estou falando são chamados de zumbis de BGP. BGP significa Border Gateway Protocol
00:00:12e é a forma como as grandes redes anunciam para quais endereços IP elas podem entregar tráfego.
00:00:18A internet é conectada por este enorme mapa global que diz às redes como alcançar umas às outras
00:00:24e tudo isso é mantido através do sistema BGP. Na maioria das vezes,
00:00:29esse sistema funciona perfeitamente, mas às vezes zumbis inesperados aparecem no sistema.
00:00:35Mas por que isso acontece? Bem, é o que vamos descobrir no vídeo de hoje.
00:00:39No sistema BGP, quando uma rede quer que o tráfego chegue a um novo local,
00:00:49ela anuncia uma rota. Quando quer que o tráfego pare de vir por um local antigo,
00:00:54ela retira essa rota. Isso acontece o tempo todo. As redes movem tráfego entre data centers,
00:01:00migram clientes para novas bordas ou retiram servidores do ar para manutenção.
00:01:04Retirar uma rota é simplesmente como elas dizem ao resto do mundo que aquele caminho não é mais válido.
00:01:09Mas às vezes algo estranho acontece. Uma rota é retirada,
00:01:13mas algumas redes continuam acreditando que ela ainda existe. Elas continuam enviando tráfego por um caminho que
00:01:20deveria ter sumido. E isso é chamado de zumbi de BGP. É uma rota obsoleta que se recusa a desaparecer
00:01:26da tabela de roteamento global, mesmo que a rede que a criou já a tenha removido.
00:01:32Então, o que acontece com o tráfego enquanto esse zumbi está vivo? Ele não chega ao destino. Ele
00:01:38pode ficar em loop entre roteadores por um momento antes de ser descartado. Pode também dar uma volta enorme
00:01:43por várias redes até chegar a um beco sem saída. Ou pode cair em uma rede que tenta
00:01:49encaminhá-lo, mas ainda assim não consegue entregá-lo a lugar nenhum útil. Na perspectiva do usuário, isso pode
00:01:55resultar em uma página travada, erro de tempo esgotado ou um app que não conecta por um curto período.
00:02:01Às vezes é quase imperceptível. Mas em outras vezes a lentidão é bem visível.
00:02:06A próxima pergunta lógica é por que os roteadores falham ao atualizar o mapa global imediatamente.
00:02:11A resposta está em como o BGP processa as mudanças. Quando uma rota mais específica desaparece,
00:02:17os roteadores buscam uma alternativa menos específica. Essa busca leva tempo. Durante essa janela,
00:02:23alguns roteadores falham em limpar a entrada antiga. Eles ficam presos a informações desatualizadas. A Cloudflare
00:02:29observou que esses zumbis duravam entre 6 e 11 minutos em redes de grande porte.
00:02:34Zumbis de IPv4 tendiam a sobreviver ainda mais do que os de IPv6. Mas, eventualmente,
00:02:40o sistema se corrige porque toda rota no BGP tem um temporizador. Se um roteador não
00:02:46recebe atualizações recentes por um tempo, ele deleta a rota automaticamente. Mesmo que um roteador perca
00:02:52a retirada da rota na primeira vez, a comunicação constante de BGP com seus vizinhos acabará
00:02:57informando que a rota sumiu. Quando roteadores vizinhos suficientes concordam com o novo estado,
00:03:03o zumbi desaparece. A Cloudflare descobriu esse comportamento ao trabalhar com clientes de BYOIP ou
00:03:09“Bring Your Own IP”. Nessas situações, a Cloudflare anuncia temporariamente o espaço de IP do cliente
00:03:15e depois o retira após a transferência. A retirada em si deveria ser limpa,
00:03:21mas eles viram que, às vezes, alguns provedores continuam usando a rota antiga muito depois dela ter
00:03:27sido removida. Esse descompasso fazia o tráfego seguir caminhos inesperados e ineficientes para a rede da Cloudflare.
00:03:33Para corrigir o problema, a Cloudflare introduziu um método mais seguro. Em vez de retirar a rota antiga
00:03:38diretamente, eles primeiro anunciam a mesma rota de um local estável. Isso força os roteadores
00:03:45ao redor do mundo a mudar de forma limpa para a nova versão. Só então eles retiram o anúncio
00:03:50antigo. Isso evita a busca por alternativas que causa os zumbis. A Cloudflare também
00:03:56ajustou seus sistemas internos para que as transições ocorram de forma mais suave no futuro. Se você quiser
00:04:02ler mais sobre este tópico, a Cloudflare publicou um post detalhado em seu blog explicando o problema.
00:04:07Concluindo, isso serve como um lembrete de que mesmo as partes fundamentais da internet podem se comportar
00:04:13de forma inesperada sob certas condições. E ainda assim, na maioria das vezes, esses problemas são resolvidos antes
00:04:19que os usuários percebam. Mas às vezes zumbis podem aparecer. A internet é mantida por milhões
00:04:25de decisões de roteamento acontecendo a cada segundo. E surpresas ocasionais como os zumbis de BGP mostram quanta
00:04:31coordenação é necessária para manter tudo funcionando. Então é basicamente isso. Agora
00:04:37você já sabe o que são zumbis de BGP. Da próxima vez que algo travar ou falhar ao carregar, você pode
00:04:43ter acabado de encontrar um zumbi na internet. Se você gosta de análises técnicas assim, não esqueça de
00:04:48clicar no botão de gostei abaixo do vídeo. E inscreva-se no nosso canal. Aqui é o Andris da Better Stack
00:04:53e vejo você nos próximos vídeos.

Key Takeaway

Zumbis de BGP são rotas obsoletas que persistem no mapa da internet após serem removidas, causando instabilidade temporária até que a sincronização global de roteadores se complete.

Highlights

O que são os Zumbis de BGP e como eles afetam o roteamento global.

A diferença entre anunciar e retirar rotas no sistema de Border Gateway Protocol.

O impacto direto na experiência do usuário

Timeline

Introdução aos Zumbis de BGP

O vídeo introduz o conceito técnico de zumbis dentro do contexto do Border Gateway Protocol, o sistema que dita como o tráfego de dados viaja pela internet. O narrador explica que o BGP funciona como um mapa global essencial para a conectividade entre grandes redes. Embora o sistema seja geralmente confiável, falhas específicas criam 'zumbis' que complicam a entrega de dados. Este trecho estabelece a premissa de que a infraestrutura invisível da web possui comportamentos inesperados. É o ponto de partida para entender como a navegação diária depende de anúncios de rota precisos.

A Dinâmica de Anúncio e Retirada de Rotas

Nesta seção, detalha-se o processo operacional de como as redes comunicam a disponibilidade de novos caminhos ou a remoção de antigos para manutenção e migração. Quando uma rota deveria desaparecer mas permanece ativa na tabela de roteamento de terceiros, ela se torna oficialmente um zumbi de BGP. O orador esclarece que a retirada de rota é um comando padrão, mas que a propagação desse comando nem sempre é imediata ou universal. O problema central ocorre quando uma rede acredita em um caminho que não existe mais na origem. Isso demonstra a complexidade de manter um mapa global de dados em constante mudança.

Consequências para o Usuário e Causas Técnicas

O tráfego destinado a uma rota zumbi acaba entrando em loops infinitos ou sendo descartado em 'becos sem saída' digitais, afetando diretamente a latência. Para o usuário final, isso se traduz em páginas que não carregam, timeouts em aplicativos ou lentidão perceptível durante a navegação. Tecnicamente, isso acontece porque os roteadores buscam alternativas menos específicas quando uma rota falha, um processo que leva tempo para processar. A Cloudflare reportou que esses zumbis sobrevivem por cerca de 6 a 11 minutos, com o IPv4 sendo mais resiliente que o IPv6. Entender esses tempos de sobrevivência é crucial para engenheiros de rede que buscam alta disponibilidade.

Mecanismos de Correção e Soluções da Cloudflare

O sistema BGP possui temporizadores internos que eventualmente forçam a limpeza dessas entradas obsoletas através da comunicação constante entre roteadores vizinhos. A Cloudflare identificou o problema ao lidar com o serviço "Bring Your Own IP", onde a transição de tráfego gerava ineficiências por conta de rotas fantasmas. Para resolver isso, eles implementaram a técnica de anunciar a rota em um local estável antes de retirar a antiga, garantindo uma transição limpa. Essa abordagem proativa evita que os roteadores entrem no modo de busca por alternativas que gera os zumbis. O segmento destaca como grandes players da infraestrutura precisam inovar para contornar limitações de protocolos antigos.

Conclusão e Reflexões Finais

O encerramento reforça que, apesar da internet ser baseada em decisões automatizadas em milissegundos, ela ainda exige uma coordenação humana e técnica imensa. O vídeo serve como um lembrete de que falhas de carregamento nem sempre são problemas locais, mas podem ser o resultado de um zumbi de BGP no meio do caminho. O narrador convida os espectadores a lerem o blog da Cloudflare para um aprofundamento técnico ainda maior sobre o tema. A conclusão destaca a natureza resiliente, porém imperfeita, da arquitetura da rede mundial de computadores. Por fim, o apresentador incentiva a inscrição no canal Better Stack para mais análises técnicas de infraestrutura.

Community Posts

View all posts