imagem_destaque-7

DeepSeek V4: O modelo de IA que desafia os gigantes americanos

A China lançou o DeepSeek V4, um modelo open-source com 1,6 biliões de parâmetros que rivaliza com o GPT-5.5 da OpenAI — e está disponível gratuitamente para qualquer empresa ou programador.

A 24 de abril de 2026, a empresa chinesa DeepSeek lançou em pré-visualização a quarta geração do seu modelo de inteligência artificial. Com dois variantes — o Pro, com 1,6 biliões de parâmetros, e o Flash, com 284 mil milhões —, o DeepSeek V4 está disponível em código aberto com licença MIT e é apontado como o mais capaz entre os modelos open-source atualmente disponíveis. A novidade agita o setor de inteligência artificial em todo o mundo, incluindo entre investidores e fabricantes de chips chineses, para quem o modelo representa mais um sinal de que a corrida tecnológica entre Pequim e Washington está longe de terminar. Para as empresas e programadores europeus, o DeepSeek V4 abre possibilidades concretas de adoção a custo próximo de zero.

O que é o DeepSeek V4 e porque é que toda a gente fala nele

A DeepSeek é uma empresa de investigação em inteligência artificial sediada na China que, nos últimos dois anos, passou de nome praticamente desconhecido fora do círculo académico a um dos principais competidores globais no desenvolvimento de grandes modelos de linguagem. Depois do impacto gerado pelo DeepSeek R1 no início de 2025, a empresa voltou a surpreender o setor com o lançamento do V4 em pré-visualização, no final de abril de 2026.

O DeepSeek V4 chega em dois sabores: o V4-Pro, com 1,6 biliões de parâmetros totais mas apenas 49 mil milhões ativados por inferência graças a uma arquitetura Mixture-of-Experts (MoE), e o V4-Flash, uma versão mais leve com 284 mil milhões de parâmetros totais e 13 mil milhões ativados. Ambos suportam uma janela de contexto de um milhão de tokens, o equivalente a processar vários livros completos numa única sessão. O que tornou o lançamento especialmente significativo foi a decisão de disponibilizar os pesos do modelo no HuggingFace sob licença MIT, permitindo que qualquer empresa ou investigador utilize, modifique e distribua o modelo sem restrições comerciais.

Arquitetura inovadora para contextos muito longos

Uma das inovações técnicas mais relevantes do DeepSeek V4 é a forma como resolve um dos problemas históricos dos grandes modelos de linguagem: a eficiência em contextos muito longos. Trabalhar com um milhão de tokens exige quantidades enormes de memória e poder de cálculo, tornando essa capacidade proibitiva para a maioria das aplicações práticas.

A solução da DeepSeek passa por um mecanismo de atenção híbrido que combina dois tipos de atenção comprimida — Compressed Sparse Attention (CSA) e Heavily Compressed Attention (HCA) — que reduz drasticamente o consumo de recursos. Nos testes internos da empresa, o V4-Pro requer apenas 27% dos FLOPs de inferência e 10% da cache KV que seriam necessários num modelo equivalente da geração anterior. Em termos práticos, isto significa que processar documentos extensos, bases de código inteiras ou históricos longos de conversação torna-se significativamente mais acessível. A arquitetura inclui ainda uma técnica chamada Manifold-Constrained Hyper-Connections (mHC), que melhora a estabilidade da propagação de sinal ao longo das camadas do modelo.

Como o DeepSeek V4 se compara com o GPT-5.5 e o Gemini

Nos benchmarks divulgados pela DeepSeek, o V4-Pro afirma liderança entre os modelos open-source em tarefas de codificação, com desempenho que rivaliza com os principais modelos fechados. Em conhecimento geral e factual, o modelo fica apenas atrás do Gemini 3.1 Pro da Google, enquanto em matemática, STEM e programação os resultados superam os restantes modelos de código aberto disponíveis. A OpenAI respondeu nos últimos dias com uma iniciativa própria: transformou um evento esgotado sobre o GPT-5.5 num programa de acesso alargado ao Codex para 8.000 programadores, numa movimentação que os analistas leem como resposta direta à pressão competitiva crescente vinda da China.

É importante notar que os benchmarks publicados pelas próprias empresas devem ser lidos com algum ceticismo: a metodologia pode favorecer os pontos fortes de cada modelo. Avaliações independentes nas próximas semanas darão uma leitura mais precisa do posicionamento real do DeepSeek V4 face aos concorrentes americanos. O que é já claro é que a distância entre os melhores modelos open-source e os modelos fechados de topo continua a comprimir-se de forma acelerada.

O impacto na corrida tecnológica global e nos chips chineses

O lançamento do DeepSeek V4 tem implicações que vão muito além do desempenho técnico. Analistas citados pela imprensa financeira internacional apontam que o avanço do modelo pode aumentar a procura por chips de IA fabricados na China, numa altura em que as restrições de exportação americanas continuam a impedir o acesso da China aos semicondutores mais avançados da NVIDIA e da AMD. Se modelos desta capacidade conseguem ser treinados e executados com hardware menos avançado, o argumento de que as sanções tecnológicas ocidentais serão eficazes a longo prazo torna-se mais difícil de sustentar.

A este contexto acresce a Iniciativa Pax Silica, o acordo liderado pelos Estados Unidos para construir cadeias de abastecimento resilientes para tecnologias de IA, à qual a Noruega aderiu formalmente esta semana. A corrida não é apenas de modelos: é de infraestrutura, de matérias-primas críticas e de soberania tecnológica, um debate que é também europeu e que Portugal, como membro da União Europeia, não pode ignorar.

O que muda para empresas e programadores em Portugal

Para as empresas e equipas de tecnologia em Portugal, o DeepSeek V4 representa uma oportunidade concreta. A licença MIT significa que o modelo pode ser utilizado em produtos comerciais sem taxas de licenciamento, integrado em infraestrutura própria sem enviar dados para servidores de terceiros, e adaptado através de fine-tuning para casos de uso específicos. Isto é particularmente relevante para setores com requisitos estritos de privacidade de dados, como a saúde, os serviços financeiros ou a administração pública.

A API oficial da DeepSeek disponibiliza o V4-Flash e o V4-Pro com preços públicos documentados, tornando a experimentação acessível mesmo para equipas pequenas. O V4-Flash, mais leve, é especialmente adequado para casos de uso em que velocidade de resposta e custo por token são prioritários. Para quem trabalha com bases de código grandes ou documentação extensa, a janela de um milhão de tokens abre possibilidades que até agora exigiam soluções de RAG (Retrieval-Augmented Generation) mais complexas.

O DeepSeek V4 é mais do que um novo modelo de inteligência artificial: é um sinal claro de que a China consolidou capacidade para competir no topo da tabela global de IA, mesmo sob pressão tecnológica e geopolítica. Para a Europa e para Portugal, a proliferação de modelos open-source desta qualidade representa uma janela de oportunidade para construir aplicações de IA sem dependência total dos grandes fornecedores americanos. Nas próximas semanas, as avaliações independentes vão clarificar onde o modelo se destaca e onde ainda fica aquém — mas o impacto já é inegável. A corrida acelerou, e quem não acompanhar o ritmo arrisca ficar para trás.



There are no comments

Add yours

Pin It on Pinterest

Share This