Plataformas Broadcast
Soluções de Dados e Conteúdos
Broadcast OTC
Plataforma para negociação de ativos
Broadcast Datafeed
APIs para integração de conteúdos e dados
Broadcast Ticker
Cotações e headlines de notícias
Broadcast Widgets
Componentes para conteúdos e funcionalidades
Broadcast Wallboard
Conteúdos e dados para displays e telas
Broadcast Curadoria
Curadoria de conteúdos noticiosos
Broadcast Quant
Plataformas Broadcast
Soluções de Dados e Conteúdos
Soluções de Tecnologia
18 de maio de 2026

Depois da corrida global pelo treinamento de grandes modelos de linguagem, empresas do setor agora enfrentam outro desafio considerado essencial para o futuro da IA: tornar a inferência mais rápida e economicamente sustentável.
É justamente por isso que a General Compute tenta construir sua estratégia de mercado. A startup aposta em uma abordagem radical: substituir a dependência de GPUs tradicionais por uma infraestrutura baseada em ASICs desenvolvidos especificamente para inference AI.
A proposta da empresa surge em um momento em que o crescimento da inteligência artificial generativa aumenta a demanda por processamento em tempo real.
Durante anos, GPUs dominaram o mercado de inteligência artificial. Empresas como a NVIDIA se tornaram referência mundial ao fornecer hardware utilizado no treinamento de modelos de linguagem e aplicações de IA.
No entanto, segundo a General Compute, existe um problema estrutural nesse modelo: GPUs foram originalmente criadas para renderização gráfica e jogos eletrônicos.
Na visão da startup, o mercado acabou adaptando esse hardware para inteligência artificial, mas sem resolver limitações relacionadas a:
• consumo energético;
• refrigeração;
• latência;
• throughput de tokens;
• movimentação de memória.
A empresa resume esse posicionamento em uma frase utilizada em sua comunicação institucional: “GPUs were built for graphics. We’re built for inference.”
A estratégia da General Compute não está voltada para treinamento de modelos, mas sim para inference AI.
Na prática, inferência é a etapa em que modelos já treinados começam a responder perguntas, executar tarefas e interagir com usuários em tempo real.
Toda vez que alguém utiliza um chatbot, um copiloto de programação ou um agente autônomo, existe um sistema realizando inferência continuamente. Segundo a empresa, o crescimento dessas aplicações está criando uma demanda gigantesca por infraestrutura especializada.
A companhia acredita que a próxima disputa da IA não será apenas sobre quem possui o modelo mais avançado, mas sobre quem consegue entregar inteligência em velocidade real.
Para tentar resolver esse desafio, a General Compute aposta em ASICs (Application-Specific Integrated Circuits). Diferentemente das GPUs tradicionais, os ASICs são chips criados especificamente para determinadas tarefas computacionais.
No caso da General Compute, os chips foram desenvolvidos exclusivamente para workloads de inferência de IA. Segundo a companhia, isso permite otimizar toda a arquitetura para:
• geração rápida de tokens;
• menor latência;
• redução de gargalos de memória;
• menor consumo energético;
• processamento contínuo em tempo real.
A empresa afirma que seus sistemas conseguem atingir velocidades entre 500 e 1.900 tokens por segundo, enquanto muitas infraestruturas tradicionais baseadas em GPU operam próximas de 100 a 120 tokens por segundo.
Um dos pilares da estratégia da General Compute é a aposta no crescimento dos agentes autônomos de IA. Segundo Finn Puklowski, o futuro da inteligência artificial será dominado por sistemas capazes de executar tarefas continuamente sem intervenção humana.
Esses agentes precisarão operar com baixa latência para conseguir:
• conversar em tempo real;
• interpretar contexto rapidamente;
• executar automações;
• acessar ferramentas externas;
• processar múltiplas solicitações simultaneamente.
Na visão da empresa, velocidade se torna um componente fundamental da própria inteligência percebida pelo usuário. Quanto mais rápido um sistema processa tokens, maior tende a ser sua capacidade operacional em ambientes complexos.
Outro ponto central da estratégia da General Compute é a eficiência energética. O crescimento da IA generativa trouxe preocupações globais relacionadas ao consumo de energia em data centers.
Além disso, muitas infraestruturas baseadas em GPUs dependem de refrigeração líquida para controlar o superaquecimento dos servidores. A General Compute afirma que seus ASICs conseguem operar utilizando apenas refrigeração a ar.
Segundo os dados divulgados pela empresa:
• racks da General Compute consomem cerca de 17 kW;
• racks equivalentes com GPUs podem ultrapassar 120 kW.
A companhia também afirma trabalhar com custos energéticos próximos de US$ 0,035 por kWh, valor significativamente abaixo da média comercial americana.
Parte da estratégia operacional da empresa envolve a instalação de projetos no Paraguai. Segundo a General Compute, o país oferece acesso a energia hidrelétrica barata, fator considerado estratégico para workloads de inteligência artificial.
Além disso, a empresa afirma conseguir reutilizar estruturas antes utilizadas para mineração de criptomoedas. Como os ASICs operam com refrigeração a ar, essas estruturas podem ser convertidas em data centers de IA com custos menores.
A companhia afirma que isso ajuda a reduzir drasticamente os gastos operacionais da infraestrutura.
Outro diferencial estratégico da General Compute é a compatibilidade com APIs da OpenAI. Segundo a empresa, desenvolvedores podem migrar aplicações realizando apenas alterações simples na base URL e na API key.
A infraestrutura também oferece:
• APIs compatíveis com OpenAI;
• deploy customizado;
• infraestrutura dedicada;
• suporte para BYOM (Bring Your Own Model);
• integração com o OpenClaw.
A estratégia da General Compute mostra que o mercado de inteligência artificial começa a olhar além dos modelos de linguagem.
Infraestrutura, eficiência energética e velocidade de inferência passam a ser fatores cada vez mais importantes para empresas que trabalham com IA em larga escala.
Ao apostar em ASICs especializados para inference AI, a General Compute tenta construir uma alternativa ao domínio das GPUs tradicionais.
Se a proposta realmente conseguir escalar globalmente, a empresa poderá ajudar a transformar a forma como sistemas de inteligência artificial são executados nos próximos anos.
Veja também