O fundador da DeepSeek, Liang Wenfeng, confirmou pessoalmente, numa comunicação interna, que o novo modelo de bandeira V4 da próxima geração será lançado oficialmente no final de abril. De acordo com especificações divulgadas, o número total de parâmetros aproxima-se de 1 bilião, com suporte a uma janela de contexto de cerca de 1 milhão de tokens e, além disso, será executado totalmente nos chips Huawei Ascend, sendo visto como um passo-chave para reduzir a dependência da NVIDIA e representar uma quebra para a IA na China.
(Antecedentes: DeepSeek V4 recusa a NVIDIA e escolhe a Huawei! A Alibaba, ByteDance e a Tencent correm para comprar chips Huawei 950PR)
(Informação adicional de contexto: A DeepSeek lançou o «Modo de Especialista» e o «Modo de Visão»; o V4 será o aquecimento final antes do lançamento oficial?)
Segundo o que foi citado pelo 《Sina Finance》, o fundador da DeepSeek, Liang Wenfeng, já revelou que o novo modelo de grandes proporções de bandeira, DeepSeek V4, será apresentado oficialmente no final de abril. Embora a empresa ainda não tenha divulgado uma data exata, a comunidade de programadores já sentiu antecipadamente os sinais de aquecimento: a variante V4-Lite está a ser testada em nós de API, a velocidade de inferência aumentou 30% face à geração anterior e a taxa de recuperação do contexto de 128K tokens atingiu 94%.
Com base nas informações não oficiais atualmente divulgadas, a arquitectura do V4 mantém o desenho Mixture-of-Experts (MoE), com um total de parâmetros na ordem de 1 bilião. No entanto, os parâmetros realmente activados por cada token rondam apenas cerca de 37 mil milhões, mantendo a eficiência de computação e o estilo habitual dos «actuários» da DeepSeek.
Quanto à janela de contexto: o V4, através de um novo módulo Engram, deverá suportar um contexto ultra-longo de 1 milhão de tokens, competindo com os modelos de topo actuais. O conceito central do Engram é a pesquisa de memória condicionada, permitindo que o modelo aceda ao conhecimento com uma complexidade de O(1), em vez de expandir linearmente com o comprimento da sequência.
Em termos de capacidades, os testes de referência divulgados indicam HumanEval a 90% e SWE-bench Verified acima de 80%; se os dados forem fiáveis, isso também se aproxima dos actuais modelos de bandeira dominantes. Quanto às modalidades, o V4 suporta nativamente entradas de texto, imagens e vídeos. A política de preços é de cerca de $0.30/MTok (entrada), mantendo a estratégia de baixo custo da DeepSeek.
Para além das especificações técnicas, o ponto que mais tem atraído a atenção do público no V4 é uma viragem total na estratégia de hardware: a empresa afirma que todo o modelo será executado inteiramente nos chips Huawei Ascend 950 PR, sem depender de quaisquer GPUs NVIDIA.
As implicações desta decisão vão muito além da própria DeepSeek. A Alibaba, a ByteDance e a Tencent já estão a comprar, em grandes quantidades, chips de próxima geração da Huawei. Se o V4 conseguir validar que o Ascend consegue sustentar as necessidades de treino e inferência dos modelos de bandeira de topo, isso será o caso de utilização prático mais convincente até agora na autonomização da cadeia de fornecimento de IA na China ao nível dos chips.
Neste contexto, as medidas de restrição dos EUA à exportação da NVIDIA podem, pelo contrário, tornar-se um catalisador para acelerar a maturidade do ecossistema autónomo da China.