Что делать, если датасета для вашей задачи не существует? Создать граббер для Google Images с помощью AWS Lambda и библиотеки Serverless.
В статье показан пример игрушечного проекта «Искусство или нет?». Модель определяет, относится ли тот или иной объект на изображении к искусству. Сначала граббер собирает датасет из результатов поиска картинок в Google или Bing, а затем разворачивает его на AWS Lambda. AWS Lambda — сервис, который запускает код в так называемом «бессерверном» (serverless) окружении. Это удобно, потому что не нужно выделять серверы для приложения, не нужно заниматься его администрированием или масштабированием изображений.
Код граббера доступен по ссылке в статье, можно его доработать и применять для создания собственных датасетов.
В статье показан пример игрушечного проекта «Искусство или нет?». Модель определяет, относится ли тот или иной объект на изображении к искусству. Сначала граббер собирает датасет из результатов поиска картинок в Google или Bing, а затем разворачивает его на AWS Lambda. AWS Lambda — сервис, который запускает код в так называемом «бессерверном» (serverless) окружении. Это удобно, потому что не нужно выделять серверы для приложения, не нужно заниматься его администрированием или масштабированием изображений.
Код граббера доступен по ссылке в статье, можно его доработать и применять для создания собственных датасетов.