News | Gate.com

Hoje

03:21

Os dados de treino do DeepSeek V4 duplicaram para 33T, despoletando instabilidade que atrasou o lançamento

Mensagem de Gate News, 24 de abril — O relatório técnico V4 da DeepSeek revela que o V4-Flash e o V4-Pro foram pré-treinados em 32T e 33T tokens, respetivamente, o dobro dos aproximadamente 15T tokens usados para o V3. O relatório reconhece ter encontrado “desafios significativos de instabilidade” durante o treino, com picos de perda a ocorrer repetidamente devido a anomalias na camada Mixture-of-Experts MoE; o mecanismo de routing em si agrava estas anomalias, e um simples rollback não consegue resolver o problema. DeepSeek implementou duas soluções agora aplicadas ao treino real: Routing Antecipatório, que desacopla o cálculo do índice de routing das atualizações da rede backbone e ativa automaticamente apenas quando são detetados picos de perda adicionando aproximadamente 20% de sobrecarga, e SwiGLU Clamping, que suprime diretamente as anomalias ao limitar os valores de ativação a um intervalo fixo. O relatório afirma que as duas abordagens são eficazes, mas admite que “os princípios subjacentes permanecem insuficientemente compreendidos”. Susan Zhang, investigadora da Google DeepMind que anteriormente trabalhou na Meta AI e na OpenAI, comentou que a instabilidade despoletada pelo dobro dos dados de treino “explica o atraso”. Ela descreveu as duas soluções como “band-aids” enquanto reconhecia a transparência técnica da DeepSeek.

Mais

06:11

A Allor Network faz parceria com a Band Protocol para integrar IA e Oráculos Descentralizados

A Allor Network fez parceria com a Band Protocol para melhorar aplicações Web3 orientadas por IA, integrando a rede de IA da Allor com a infraestrutura descentralizada de oráculos da Band, melhorando o acesso a dados do mundo real para aplicações em blockchain.

Mais

BAND0,45%

02:30

Uma carteira realizou transacções de tipo “band” em ETH e obteve um lucro de 25,6 mil dólares, tendo já concluído a realização de lucros e a saída da posição.

ethereum news

Notícias da Gate. Mensagem, a 7 de abril, segundo a monitorização da analista cripto Ai Yí, um determinado endereço fez uma entrada de 4.827 ETH entre 4 de abril e 5 de abril a cerca de 2047.53 dólares, e vendeu a 7 de abril por cerca de 2100.94 dólares. Este lote de ETH foi transferido para uma determinada CEX e convertido em USDT nas últimas 3 horas, com um valor de transação de cerca de 10,14 milhões de dólares. Nesta operação em ciclo, foi obtido um lucro de cerca de 256 mil dólares, ou seja, cerca de 25,6 milhões de dólares.

Mais

ETH-0,91%

01:49

BAND（Band）24 horas Aumento 16.12%

Gate News Bot消息，12月02日，据CoinMarketCap行情，截至发稿时，BAND（Band）现报 0.47 dólares, 24 horas内 subir 16.12%, 最高触及 0.51 dólares, 最低回落至 0.37 dólares. 当前 capitalização de mercado 约为 79.10 mil dólares, 较昨日 subir 110 mil dólares. Band é a camada de dados unificada para AI e Web3. Como uma plataforma de dados impulsionada pela comunidade, a Band tem se dedicado à segurança dos dados em cadeia desde 2018. Ela fornece conexão de dados financeiros em tempo real para aplicações Web3, oferecendo informações atualizadas e atualizações de conhecimento de AI para LLM através dos Data Hunters, e fornece aleatorização verificável para jogos. Atualmente, a Band já suporta mais de 40 cadeias, com mais de 11 fontes de dados e mais de 70 validadores, totalizando o bloqueio.

Mais

BAND0,45%

USDC-0,01%