Grok lança som de clonagem: grave um minuto e crie sua própria voz de IA

robot
Geração de resumo em curso

Notícias do CoinWorld, Grok lança função de clonagem de voz, os utilizadores só precisam de gravar um minuto de voz para gerar a sua própria voz AI.
Esta funcionalidade permite aos utilizadores gravar voz no console xai, gerar um voice_id e integrar na API de TTS ou voice agent do Grok, sendo aplicável a cenários como atendimento ao cliente, criação de conteúdo, personagens de jogos e narração de audiolivros.
Os utilizadores devem ler uma frase de validação, o sistema transcreve em tempo real via STT e compara as características da gravação, confirmando o orador antes de gerar a voz, para evitar clonagem de vozes de terceiros.
Atualmente, a funcionalidade de vozes personalizadas está disponível apenas nos EUA, excluindo Illinois, com o console permitindo criar até 30 vozes personalizadas gratuitamente, e a capacidade de criação via API disponível apenas para equipas empresariais.
Vozes personalizadas não têm custo adicional, mas a utilização da API de voz é cobrada por volume: $3.00/hora em tempo real, e $4.20 por milhão de caracteres para conversão de texto em voz.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar