за 2 минуты сгенерил вот такой вот видос на сайте www.mangatv.shop, который кинул автор в один из чатиков по нейронкам
под капотом происходит примерно следующее:
1️⃣ запрос в чатгпт «сгенерируй длинную и подробную историю про X»
2️⃣ текст отдаётся на генерацию голоса. в гугл спич. есть несколько вариантов, можно выбрать пол, например. на английском качество в разы лучше
3️⃣ история разбивается на куски, возможно на каждый кусок делается запрос в чатгпт «опиши что может быть иллюстрацией истории Х»
4️⃣ каждый такой ответ дополняется словами в зависимости от сеттинга, который ты выбрал (anime, comics, marvel, disney). например для anime добавляются слова cute 3d shining etc
5️⃣ запросы на картинки передаются для генерации в стейблдифюжн
6️⃣ собирают все картинки в видео, на который накладывается текст и озвучивается голосом, который тоже сгенерился
💰 зарабатывает сейчас сайт так: «If you want to create royalty-free video with GPT-4, you can always try our paid plan. 3h of video for 9.99/m included or 99/y for unlimited»
🌱 для улучшения качества есть три переменные, которые автор может и будет тюнить:
- качество генерации истории (с гпт4 стало выше, вообще забавно наблюдать что он допридумал)
- качество генерации картинок (стейбл дифьюжн хорошеет с каждым месяцев, а потом может и самому можно будет нарисовать через controlnet )
- качество озвучки (тут может быть просто запрос на апи, которые сами по себе улучшаются с каждым днём)
самому сделать точно такую историю с видосом заняло бы минимум дня 3-5 если освоить все инструменты, но качество (истории и картинок) было бы лучше процентов 30
промпт был таким (лучше вначале посмотреть результат, а потом prompt): Сделай историю про космический город на спине летающей в галактике черепахи, в котором живёт бедный гуманоид, который увидел несправедливость в том, что его друг на государственной службе был космическим строителем и потерял ноги, но ему не выплачивают за это пенсию. Он думает создать анархическую ячейку сеттинг: аниме
сделал вторую часть тоже, кидать?
под капотом происходит примерно следующее:
1️⃣ запрос в чатгпт «сгенерируй длинную и подробную историю про X»
2️⃣ текст отдаётся на генерацию голоса. в гугл спич. есть несколько вариантов, можно выбрать пол, например. на английском качество в разы лучше
3️⃣ история разбивается на куски, возможно на каждый кусок делается запрос в чатгпт «опиши что может быть иллюстрацией истории Х»
4️⃣ каждый такой ответ дополняется словами в зависимости от сеттинга, который ты выбрал (anime, comics, marvel, disney). например для anime добавляются слова cute 3d shining etc
5️⃣ запросы на картинки передаются для генерации в стейблдифюжн
6️⃣ собирают все картинки в видео, на который накладывается текст и озвучивается голосом, который тоже сгенерился
💰 зарабатывает сейчас сайт так: «If you want to create royalty-free video with GPT-4, you can always try our paid plan. 3h of video for 9.99/m included or 99/y for unlimited»
🌱 для улучшения качества есть три переменные, которые автор может и будет тюнить:
- качество генерации истории (с гпт4 стало выше, вообще забавно наблюдать что он допридумал)
- качество генерации картинок (стейбл дифьюжн хорошеет с каждым месяцев, а потом может и самому можно будет нарисовать через controlnet )
- качество озвучки (тут может быть просто запрос на апи, которые сами по себе улучшаются с каждым днём)
самому сделать точно такую историю с видосом заняло бы минимум дня 3-5 если освоить все инструменты, но качество (истории и картинок) было бы лучше процентов 30
промпт был таким (лучше вначале посмотреть результат, а потом prompt): Сделай историю про космический город на спине летающей в галактике черепахи, в котором живёт бедный гуманоид, который увидел несправедливость в том, что его друг на государственной службе был космическим строителем и потерял ноги, но ему не выплачивают за это пенсию. Он думает создать анархическую ячейку сеттинг: аниме
сделал вторую часть тоже, кидать?