DeepSeek V4 será lançado no final de abril, confirmado internamente por Liang Wenfeng: uma janela de 1 milhão de tokens, totalmente executado nos chips Huawei Ascend 950 PR

O fundador da DeepSeek, Liang Wenfeng, confirmou pessoalmente, numa comunicação interna, que o novo modelo de bandeira V4 da próxima geração será lançado oficialmente no final de abril. De acordo com especificações divulgadas, o número total de parâmetros aproxima-se de 1 bilião, com suporte a uma janela de contexto de cerca de 1 milhão de tokens e, além disso, será executado totalmente nos chips Huawei Ascend, sendo visto como um passo-chave para reduzir a dependência da NVIDIA e representar uma quebra para a IA na China.
(Antecedentes: DeepSeek V4 recusa a NVIDIA e escolhe a Huawei! A Alibaba, ByteDance e a Tencent correm para comprar chips Huawei 950PR)
(Informação adicional de contexto: A DeepSeek lançou o «Modo de Especialista» e o «Modo de Visão»; o V4 será o aquecimento final antes do lançamento oficial?)

Segundo o que foi citado pelo 《Sina Finance》, o fundador da DeepSeek, Liang Wenfeng, já revelou que o novo modelo de grandes proporções de bandeira, DeepSeek V4, será apresentado oficialmente no final de abril. Embora a empresa ainda não tenha divulgado uma data exata, a comunidade de programadores já sentiu antecipadamente os sinais de aquecimento: a variante V4-Lite está a ser testada em nós de API, a velocidade de inferência aumentou 30% face à geração anterior e a taxa de recuperação do contexto de 128K tokens atingiu 94%.

Mil milhões de parâmetros, janela de milhões de tokens

Com base nas informações não oficiais atualmente divulgadas, a arquitectura do V4 mantém o desenho Mixture-of-Experts (MoE), com um total de parâmetros na ordem de 1 bilião. No entanto, os parâmetros realmente activados por cada token rondam apenas cerca de 37 mil milhões, mantendo a eficiência de computação e o estilo habitual dos «actuários» da DeepSeek.

Quanto à janela de contexto: o V4, através de um novo módulo Engram, deverá suportar um contexto ultra-longo de 1 milhão de tokens, competindo com os modelos de topo actuais. O conceito central do Engram é a pesquisa de memória condicionada, permitindo que o modelo aceda ao conhecimento com uma complexidade de O(1), em vez de expandir linearmente com o comprimento da sequência.

Em termos de capacidades, os testes de referência divulgados indicam HumanEval a 90% e SWE-bench Verified acima de 80%; se os dados forem fiáveis, isso também se aproxima dos actuais modelos de bandeira dominantes. Quanto às modalidades, o V4 suporta nativamente entradas de texto, imagens e vídeos. A política de preços é de cerca de $0.30/MTok (entrada), mantendo a estratégia de baixo custo da DeepSeek.

Corre totalmente em chips da Huawei: o maior sinal geopolítico

Para além das especificações técnicas, o ponto que mais tem atraído a atenção do público no V4 é uma viragem total na estratégia de hardware: a empresa afirma que todo o modelo será executado inteiramente nos chips Huawei Ascend 950 PR, sem depender de quaisquer GPUs NVIDIA.

As implicações desta decisão vão muito além da própria DeepSeek. A Alibaba, a ByteDance e a Tencent já estão a comprar, em grandes quantidades, chips de próxima geração da Huawei. Se o V4 conseguir validar que o Ascend consegue sustentar as necessidades de treino e inferência dos modelos de bandeira de topo, isso será o caso de utilização prático mais convincente até agora na autonomização da cadeia de fornecimento de IA na China ao nível dos chips.

Neste contexto, as medidas de restrição dos EUA à exportação da NVIDIA podem, pelo contrário, tornar-se um catalisador para acelerar a maturidade do ecossistema autónomo da China.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário