Нейросеть AudioLDM

AudioLDM — система, основанная на нейросетях и искусственном интеллекте, позволяет генерировать аудио из текстовых описаний. Эта технология позволяет создавать качественное аудио с высокой эффективностью вычислений. Обученная на AudioCaps с использованием одного графического процессора, AudioLDM достигает передовой производительности в области генерации аудио по тексту, измеренной как объективными, так и субъективными метриками. Кроме того, AudioLDM является первой системой, позволяющей различные манипуляции с аудио по текстовым инструкциям (например, перенос стилей) в нулевом режиме.

Перейти

ОтветитьОтменить ответ