Без сна и отдыха: что делал ИИ на этой неделе?
1. В Facebook придумали нейросеть, которая создает голоса людей (пока только знаменитостей). Для генерации аудиосигналов исследователи использовали спектрограммы — это визуальное представление аудиосигналов в 2D, которое отражает изменения голосе в тайм-лайне. А для датасета взяли аудиокниги и пятьсот часов программы TED — с оживленной манерой речи, необходимой для обучения нейросети. Забавно, что компания не стала имитировать Цукерберга, которого на прошлой неделе «дипфейкнули» активисты, вместо этого ИИ игрался с голосом Билла Гейтса.
2. Кстати, про Microsoft: в новой версии PowerPoint можно репетировать выступление перед ИИ. Ваш единственный слушатель примостится в нижнем углу экрана и даст подсказки во время речи, укажет на слова-паразиты, а также упрекнет в использовании избитых фраз. Также в обновлении появится еще одна нейросеть: ее задача — проанализировать корпоративный стиль и предложить подходящий шрифт и цвет для презентации. Ждем релиза!
3. Помните алгоритм GauGAN от NVIDIA, которая превращает примитивную картинку в шедевр фотографии? Коротко — это генеративно-состязательная нейронная сеть для обработки сегментированных изображений. Ее обучили на фотографиях реальных мест, поэтому сетка учитывает тени, текстуры и детали. А новость в том, что теперь любой может опробовать технологию. Осторожно — затягивает.
1. В Facebook придумали нейросеть, которая создает голоса людей (пока только знаменитостей). Для генерации аудиосигналов исследователи использовали спектрограммы — это визуальное представление аудиосигналов в 2D, которое отражает изменения голосе в тайм-лайне. А для датасета взяли аудиокниги и пятьсот часов программы TED — с оживленной манерой речи, необходимой для обучения нейросети. Забавно, что компания не стала имитировать Цукерберга, которого на прошлой неделе «дипфейкнули» активисты, вместо этого ИИ игрался с голосом Билла Гейтса.
2. Кстати, про Microsoft: в новой версии PowerPoint можно репетировать выступление перед ИИ. Ваш единственный слушатель примостится в нижнем углу экрана и даст подсказки во время речи, укажет на слова-паразиты, а также упрекнет в использовании избитых фраз. Также в обновлении появится еще одна нейросеть: ее задача — проанализировать корпоративный стиль и предложить подходящий шрифт и цвет для презентации. Ждем релиза!
3. Помните алгоритм GauGAN от NVIDIA, которая превращает примитивную картинку в шедевр фотографии? Коротко — это генеративно-состязательная нейронная сеть для обработки сегментированных изображений. Ее обучили на фотографиях реальных мест, поэтому сетка учитывает тени, текстуры и детали. А новость в том, что теперь любой может опробовать технологию. Осторожно — затягивает.