Voicebox by Meta

Voicebox-это генеративная модель искусственного интеллекта для речи, разработанную Meta, которая может обобщать задачи генерации речи. Она не была специально обучена выполнять с современным результатом. Он может синтезировать речь на шести языках, а также выполнять удаление шума, редактирование контента, преобразование стиля и разнообразное генерацию выборки. Модель основана на методе, называемом соответствием потока, который, как было показано, улучшается на диффузионных моделях. Voicebox превосходит текущее состояние художественной английской модели Vall-E на нулевом выстреле текста в речь с точки зрения как разборчивости, так и сходства аудио, в то же время в 20 раз быстрее.

Попробовать
 


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *