Plataformas Broadcast
Soluções de Dados e Conteúdos
Broadcast OTC
Plataforma para negociação de ativos
Broadcast Data Feed
APIs para integração de conteúdos e dados
Broadcast Ticker
Cotações e headlines de notícias
Broadcast Widgets
Componentes para conteúdos e funcionalidades
Broadcast Wallboard
Conteúdos e dados para displays e telas
Broadcast Curadoria
Curadoria de conteúdos noticiosos
Broadcast Quant
Plataformas Broadcast
Soluções de Dados e Conteúdos
Soluções de Tecnologia
24 de outubro de 2025
Por Alice Labate, do Estadão
São Paulo, 24/10/2025 – A Amazon divulgou nesta quinta-feira, 23, uma explicação oficial sobre a interrupção que afetou o Amazon Web Services (AWS) na segunda-feira e deixou sites e serviços fora do ar no mundo todo. Segundo a companhia, o problema começou com um bug muito raro em um software importante e foi piorado por uma “automação defeituosa” que apagou informações essenciais da rede interna.
A falha atingiu a região da Virgínia do Norte, nos EUA, conhecida como “US-EAST-1”. Essa é a região mais usada do AWS no planeta, então, quando ela para, milhares de plataformas ficam sem funcionar, porque dependem dessa infraestrutura para armazenar dados e operar seus sistemas na internet.
O incidente começou às 03h48 (horário de Brasília) de segunda-feira, 20, e só foi resolvido às 18h20, após várias ondas de instabilidade. A Amazon já havia descartado ataque externo ou problema físico nos equipamentos – agora ela explica que o que houve foi uma falha em cascata dentro de seus próprios sistemas digitais.
O primeiro serviço afetado foi o DynamoDB, banco de dados da AWS usado para guardar grandes volumes de informação com alta velocidade, e ele depende do DNS, um sistema que funciona como “agenda de contatos da internet”, indicando para onde cada programa deve enviar os dados. Quando os registros do DynamoDB sumiram, não era possível encontrar esses dados.
A Amazon contou que dois sistemas internos, responsáveis por atualizar o DNS dos serviços da nuvem, passaram a “discordar” entre si sobre qual era a informação correta e, nessa disputa, eles acabaram apagando o registro principal do DynamoDB na região. Quando esse registro sumiu, os serviços que dependiam dele ficaram sem saber para onde enviar os pedidos e perderam a comunicação.
Sem conseguir acessar o DynamoDB, outros serviços da AWS começaram a falhar, incluindo o EC2, que fornece servidores (instâncias) na nuvem e permite que empresas e aplicativos mantenham sites, serviços e sistemas funcionando sem precisar de máquinas físicas. As instâncias que já estavam ativas continuaram operando normalmente, mas novas não conseguiram ser iniciadas, o que impediu empresas e aplicativos de adicionar novos servidores para atender mais usuários.
Outro serviço afetado foi o balanceador de carga de rede (NLB). Esse sistema atua como um organizador do tráfego: quando muitas pessoas acessam um site ou aplicativo ao mesmo tempo, ele distribui essas conexões entre os servidores disponíveis para evitar sobrecarga. Durante a falha, como as informações de rede estavam atrasadas, o NLB passou a considerar alguns servidores que estavam funcionando normalmente como se estivessem com defeito e os retirou do serviço.
O impacto piorou ainda mais quando funções Lambda (tecnologia que executa pequenos pedaços de código sem precisar de servidor fixo) começaram a falhar. Com isso, processos automáticos de diversos aplicativos ficaram travados ou lentos, causando ainda mais erro para quem tentava usar serviço online.
No geral, a interrupção afetou serviços como Amazon Connect (plataforma de atendimento ao cliente), ECS e EKS (que rodam pacotes que reúnem tudo que um programa precisa para funcionar, usados por empresas do mundo todo). Muitos consumidores enfrentaram mensagens de erro, páginas fora do ar e problemas em pagamentos, pedidos e acessos.
A recuperação do sistema só foi possível depois que equipes de engenheiros intervieram manualmente, desativando a automação com defeito e reconstruindo os registros de rede. Em comunicado, a Amazon pediu desculpas pelos transtornos causados e afirmou que pretende adicionar novas camadas de segurança, além de acelerar os processos de recuperação, para evitar que um problema localizado se espalhe novamente pelo mundo.
Veja também