Babbitt News, 16 июня, Meta объявила о выпуске модели искусственного интеллекта для генерации речи «Voicebox», которая поддерживает генерацию речи из текста, может сопоставлять стили звука на основе сэмплов продолжительностью всего две секунды и преобразовывать текстовые сэмплы на другой язык. Учитывая отдельные образцы речи, он читает переведенный текст оригинальным голосом говорящего, в настоящее время на шести языках: английском, французском, немецком, испанском, польском и португальском.
Meta заявила, что Voicebox также может заставить виртуальных помощников и неигровых персонажей в метавселенной издавать естественные голоса, и это может позволить слабовидящим людям слышать письменные сообщения от друзей, которые ИИ читает их голосами, предоставляя создателям новые инструменты для легкого Создания и редактировать звуковые дорожки для видео и многое другое.