transformers
теперь можно использовать с аудио. В новую версию Hugging Face добавили фейсбучную Wav2Vec, которую теперь можно брать и применять, и даже комбинировать с другими моделями, чтобы делать, например, транскрибацию. Вот
пример как это работает прямо в браузере.