A estratégia da General Compute para substituir GPUs na inferência de IA

18 de maio de 2026

General Compute aposta em ASICs para acelerar inferência de inteligência artificial. General Compute / Divulgação

Depois da corrida global pelo treinamento de grandes modelos de linguagem, empresas do setor agora enfrentam outro desafio considerado essencial para o futuro da IA: tornar a inferência mais rápida e economicamente sustentável.

É justamente por isso que a General Compute tenta construir sua estratégia de mercado. A startup aposta em uma abordagem radical: substituir a dependência de GPUs tradicionais por uma infraestrutura baseada em ASICs desenvolvidos especificamente para inference AI.

A proposta da empresa surge em um momento em que o crescimento da inteligência artificial generativa aumenta a demanda por processamento em tempo real.

O problema da infraestrutura atual de IA

Durante anos, GPUs dominaram o mercado de inteligência artificial. Empresas como a NVIDIA se tornaram referência mundial ao fornecer hardware utilizado no treinamento de modelos de linguagem e aplicações de IA.

No entanto, segundo a General Compute, existe um problema estrutural nesse modelo: GPUs foram originalmente criadas para renderização gráfica e jogos eletrônicos.

Na visão da startup, o mercado acabou adaptando esse hardware para inteligência artificial, mas sem resolver limitações relacionadas a:

• consumo energético;

• refrigeração;

• latência;

• throughput de tokens;

• movimentação de memória.

A empresa resume esse posicionamento em uma frase utilizada em sua comunicação institucional: “GPUs were built for graphics. We’re built for inference.”

O foco da empresa está na inferência

A estratégia da General Compute não está voltada para treinamento de modelos, mas sim para inference AI.

Na prática, inferência é a etapa em que modelos já treinados começam a responder perguntas, executar tarefas e interagir com usuários em tempo real.

Toda vez que alguém utiliza um chatbot, um copiloto de programação ou um agente autônomo, existe um sistema realizando inferência continuamente. Segundo a empresa, o crescimento dessas aplicações está criando uma demanda gigantesca por infraestrutura especializada.

A companhia acredita que a próxima disputa da IA não será apenas sobre quem possui o modelo mais avançado, mas sobre quem consegue entregar inteligência em velocidade real.

ASICs como alternativa às GPUs

Para tentar resolver esse desafio, a General Compute aposta em ASICs (Application-Specific Integrated Circuits). Diferentemente das GPUs tradicionais, os ASICs são chips criados especificamente para determinadas tarefas computacionais.

No caso da General Compute, os chips foram desenvolvidos exclusivamente para workloads de inferência de IA. Segundo a companhia, isso permite otimizar toda a arquitetura para:

• geração rápida de tokens;

• menor latência;

• redução de gargalos de memória;

• menor consumo energético;

• processamento contínuo em tempo real.

A empresa afirma que seus sistemas conseguem atingir velocidades entre 500 e 1.900 tokens por segundo, enquanto muitas infraestruturas tradicionais baseadas em GPU operam próximas de 100 a 120 tokens por segundo.

Inferência mais rápida para agentes autônomos

Um dos pilares da estratégia da General Compute é a aposta no crescimento dos agentes autônomos de IA. Segundo Finn Puklowski, o futuro da inteligência artificial será dominado por sistemas capazes de executar tarefas continuamente sem intervenção humana.

Esses agentes precisarão operar com baixa latência para conseguir:

• conversar em tempo real;

• interpretar contexto rapidamente;

• executar automações;

• acessar ferramentas externas;

• processar múltiplas solicitações simultaneamente.

Na visão da empresa, velocidade se torna um componente fundamental da própria inteligência percebida pelo usuário. Quanto mais rápido um sistema processa tokens, maior tende a ser sua capacidade operacional em ambientes complexos.

Eficiência energética como diferencial

Outro ponto central da estratégia da General Compute é a eficiência energética. O crescimento da IA generativa trouxe preocupações globais relacionadas ao consumo de energia em data centers.

Além disso, muitas infraestruturas baseadas em GPUs dependem de refrigeração líquida para controlar o superaquecimento dos servidores. A General Compute afirma que seus ASICs conseguem operar utilizando apenas refrigeração a ar.

Segundo os dados divulgados pela empresa:

• racks da General Compute consomem cerca de 17 kW;

• racks equivalentes com GPUs podem ultrapassar 120 kW.

A companhia também afirma trabalhar com custos energéticos próximos de US$ 0,035 por kWh, valor significativamente abaixo da média comercial americana.

Paraguai como peça estratégica

Parte da estratégia operacional da empresa envolve a instalação de projetos no Paraguai. Segundo a General Compute, o país oferece acesso a energia hidrelétrica barata, fator considerado estratégico para workloads de inteligência artificial.

Além disso, a empresa afirma conseguir reutilizar estruturas antes utilizadas para mineração de criptomoedas. Como os ASICs operam com refrigeração a ar, essas estruturas podem ser convertidas em data centers de IA com custos menores.

A companhia afirma que isso ajuda a reduzir drasticamente os gastos operacionais da infraestrutura.

Compatibilidade com OpenAI

Outro diferencial estratégico da General Compute é a compatibilidade com APIs da OpenAI. Segundo a empresa, desenvolvedores podem migrar aplicações realizando apenas alterações simples na base URL e na API key.

A infraestrutura também oferece:

• APIs compatíveis com OpenAI;

• deploy customizado;

• infraestrutura dedicada;

• suporte para BYOM (Bring Your Own Model);

• integração com o OpenClaw.

Uma possível mudança no mercado de IA

A estratégia da General Compute mostra que o mercado de inteligência artificial começa a olhar além dos modelos de linguagem.

Infraestrutura, eficiência energética e velocidade de inferência passam a ser fatores cada vez mais importantes para empresas que trabalham com IA em larga escala.

Ao apostar em ASICs especializados para inference AI, a General Compute tenta construir uma alternativa ao domínio das GPUs tradicionais.

Se a proposta realmente conseguir escalar globalmente, a empresa poderá ajudar a transformar a forma como sistemas de inteligência artificial são executados nos próximos anos.

Veja também

Esporte

A generosidade da Fifa

broadcast weekend

O futuro verde da Petrobras

broadcast weekend

Alto renome: PIX

broadcast weekend

O novo consumidor do happy hour

Política

Meu momento

Política

Falta de traquejo

internacional

Até agora, nada !

Política

Procura-se Romário

Esporte

Vai Brasillll

broadcast weekend

O grande teste para Trump

broadcast weekend

Pré-sal da era digital: salários altos e falsas vagas

broadcast weekend

A vanguarda da tecnologia invade Wall Street

Política Monetária

Muro de arrimo

internacional

Um clima terrrrrível

internacional

Já é recessão no Canadá

broadcast weekend

O lado esquecido da IA

broadcast weekend

Um novo teste para a Reforma Tributária

destaque

Na Copa, CEO é torcedor, dá palpite e troca figurinha

Tecnologia

Fora do radar da IA?

broadcast weekend

A nova rota global da IA

broadcast weekend

O varejo reaprende o básico

broadcast weekend

Crédito pega carona na China

Negócios

Novo normal?

Sem categoria

O léxico da IA

Negócios

Foods em guerra

broadcast weekend

Mercado global vive a era de barreiras invisíveis

broadcast weekend

Esporte virou símbolo de status nos negócios

broadcast weekend

O cálculo bilionário por trás da conta de luz brasileira

seguros

Efeito dominó?

Política

Contrarregra eleitoral

saneamento

Exercício de fé

internacional

Dono de Downing Street

Política

A volta das blusinhas

broadcast weekend

De Copacabana aos negócios

broadcast weekend

O mundo de centavos: como a IA está redesenhando o custo da economia e do trabalho

broadcast weekend

Guerra no Oriente Médio chega ao balanço das construtoras

Política

Ausência notada

Ações

Pouco badalado

Agro

Pragmatismo e política

Política

Bullying diplomático

broadcast weekend

Como Luana Lara planeja conquistar o mercado com sua bilionária Kalshi

broadcast weekend

No ensino a distância, o mercado precisa ‘voltar às aulas’

broadcast weekend

A Davos brasileira em Nova York

Negócios

Sorriso amarelo

internacional

Guerra e Paz na Colômbia

Agro

Casamento, TI e negócios

Copa do Mundo 2026

Um rim por um ingresso

futebol

Nu tem mundial

Cade

Gustavo Lima se despede

Política

Esquenta eleitoral

internacional

TACO 2.0

mercado imobiliário

Minha Vida tunada

internacional

Controle de danos

Mercado financeiro

Faria Lima de Miami

Política

A última dança

Negócios

Dívidas de guerra

Política Monetária

Inferno astral

Economia

Poder feminino

Negócios

Ver para crer

internacional

Um novo Plano Marshall

Agro

Pode virar pânico

comércio exterior

Foco no Mercosul

internacional

Contradições globais

Política Monetária

The clock is ticking

internacional

Contra-ataque dos aliados

Política

Juros no menu

Economia

Conta é alta, mas se paga

Negócios

Arábia elétrica?

internacional

Há música em Davos

internacional

Centro do mundo

Mundo cripto

Do papel-moeda à stablecoin

Acordo Comercial

26 anos

Tecnologia

Em destaque, os techstars!

Investimentos

Nem tudo o que reluz é ouro

4 de Julho

O dono da festa

Economia

Pressão regulada

Política

Lula e a maquete

Política Monetária

Pole position

internacional

Republicanos em apuros

Investimentos

De rebelde a refém

internacional

Aceita um taco?

futebol

Novo amor

Negócios

Só os árabes salvam

ESG

COP dos protestos

Política Monetária

Menino de ouro?

Política

Êêêêê Faraó!

Política Monetária

Em terra de cego…

COP30

Simpatia é o nome do jogo

internacional

Bomba-relógio argentina

Agro

Minoria? não dessa vez…

Negócios

Arábia Sadia

Negócios

Cadê o Cade?

Negócios

Quem matou a Ford?

Política

Aceno duplo de Lula

internacional

A estrela democrata

Economia

Ouro em disparada

Política Monetária

Os 11 escalados

Inovação

Higiene mental

Política

Sancho Geraldo Pança

Por trás da notícia

Golden hour

internacional

Dados pelo ralo…

Agro

Café americano

internacional

E a Groenlândia?

Política externa

Gogó e prestígio

Política

Soberania, my friend

Política Monetária

Mera semelhança

Política

Às avessas

Política

Atirou no que viu…

Política externa

Quem diria?

internacional

Pequeno gigante

internacional

De dentro do Fed?

Negócios

Ares e risos

Mercado financeiro

Um mercado futurólogo

Mercado financeiro

IA para dar e vender

internacional

‘DR’ na Casa Branca

Meio ambiente

Briga de gigantes

Clima

Pedagogia da COP30

Agro

Fora, antivax!

Investimentos

Poupançudos sustentáveis

Economia

Emplastro Brás Cubas

Mídia

Direto do Limão

futebol

Ele, finalmente, está entre nós

Política Monetária

Do gerúndio ao pretérito perfeito

internacional

Globo de Ouro Financeiro

internacional

Coreografia monetária

internacional

EUA e o ‘Dia do Fico’

Política Monetária

Levantamento de juros

Política

Tempos caninos

Política

Imagem e semelhança

Economia

Almoço com as estrelas

internacional

Ecos do passado

futebol

Quanto custa um erro?

Economia

Cadê meu ovo de chocolate?

Negócios

Amor e ódio

Negócios

Saudades do feirão

Política

2026 tá aí

Política externa

Semântica de Sidônio

Negócios

Ele é…Elon Musk

Política

O leque de Gleisi

Agro

Quaresma dos ovos de ouro

Agro

Pergunta aí !

Política

Imã de prefeitos

futebol

Santos e o ‘menino Ney’

futebol

Inflação do Super Bowl

internacional

O aprendiz

internacional

Aberto a reformas

Agro

Relax canino

Mundo cripto

Bilhões e memes

Ajuste fiscal

Xadrez britânico

Política

O que é, o que é?

Política

Posturado e calmo

Vida em Marte

Vai ter Netflix em Marte?

internacional

Isso sim é uma festa danada!

futebol

Comandados de Rogério Ceni

Clima

Picolé de COP-30

Mercado financeiro

Mau presságio para Wall Street?

Política

“Não abracem o Lula”

Economia

Haddad, o Sr. Confiança

Política

Longe do Mar

Política Monetária

Sem Autonomia

Economia

O dono da receita

Política Monetária

Pão de queijo com dólar

Política

Operado em segredo

Política externa

Vai dar casamento?

Política

Sorrisos e recados

Agro

Crise de imagem

Política fiscal

Agora vai?

Clima

Leve-me a Tchôruglu

Política

Corpo entre Poderes

Política

Palanque pronto

Política

Celulares vetados

ESG

Ar condicionado

Negócios

Pelos ares

Agro

O terceiro idioma

futebol

Injustiça ou política?

Negócios

Leitura apressada

Política

Homeoffice presidencial

Agro

Chove chuva

Política

E o Novo envelheceu

Negócios

Helipa City

Economia

A tal pergunta

Agro

Pegando fogo

Política Monetária

Ação antivazamento

Política

Lula e o agro

Saúde

Gato ou coelho?

Economia

Gesto simbólico

Agro

Haja água!

Política

Presidente-chamariz

Eleições EUA

Trump morde a isca

Política

Lula e os drones

Agro

Fim da novela

Ações

Sonho de verão

Política

Ao pé do ouvido

Ações

Aposta certeira

Agro

Vou de táxi ?

Ações

Calma, ainda não desafinou

Política Agrícola

Missão quase impossível

Política Monetária

Anúncio surpresa

Eleições EUA

Harris X Trump: cara ou coroa?