A mais recente inovação em IA da Microsoft acaba de chegar - VibeVoice-Realtime-0.5B está oficialmente disponível. Este sistema traz um motor TTS com 1,5 mil milhões de parâmetros que está a superar todos os benchmarks atuais. O que me chamou a atenção? O tempo de resposta quase instantâneo - estamos a falar de cerca de 300 milissegundos até ouvir o primeiro som. Isto é extremamente rápido para conversão de texto em fala. E aqui está o melhor: é totalmente open-source sob licença MIT, o que significa que os developers podem realmente construir com esta tecnologia sem preocupações de licenciamento. Para quem trabalha em interfaces de voz ou ferramentas de comunicação em tempo real, isto pode ser uma verdadeira revolução. O facto de um gigante tecnológico lançar algo tão poderoso para a comunidade? É precisamente este tipo de iniciativa que acelera a inovação em todo o setor.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 4
  • Republicar
  • Partilhar
Comentar
0/400
WalletWhisperervip
· 23h atrás
300ms de latência... o reconhecimento de padrões está em alerta máximo. A jogada de open-source é uma estratégia clássica de acumulação—fica atento aos indicadores comportamentais a desenrolar-se.
Ver originalResponder0
GateUser-75ee51e7vip
· 23h atrás
Sai som em apenas 300 milissegundos? Desta vez a Microsoft não estava a exagerar, esta jogada open-source do MIT é realmente impressionante.
Ver originalResponder0
SpeakWithHatOnvip
· 23h atrás
Somente 300 milissegundos para emitir som? A Microsoft desta vez realmente surpreendeu, e ainda por cima é open-source com licença MIT. Agora os programadores vão mesmo gostar disto.
Ver originalResponder0
CryptoMomvip
· 23h atrás
300 milissegundos para responder? Esta velocidade é realmente incrível, finalmente é possível fazer conversas em tempo real.
Ver originalResponder0
  • Fixar
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)