AudioLDM — нейронка которая создает звуки по текстовому запросу



Для хорошего результата рекомендуют использовать большое количество прилагательных для описания звука. Примеры которые указаны в генераторе, звучат неплохо. Но если попробовать создать что-то забавное, например "Гномы в доспехах прыгают на батуте", то получится просто месиво звуков