В продуктах на нейросетях оценка возраста и пола обычно проходит в два этапа: поиск лиц на фотографии и собственно определение пола и возраста.



Вот как решается первая задача в предложенной авторами модели:

«Используется метод опорных векторов [...] который запускается на HOG + SIFT представлении изображения. Представления HOG и SIFT — это тщательно вручную подобранные функции, ставшие результатом многолетнего опыта в создании систем распознавания образов. Оказалось, что это представление хорошо работает с атомарными методами, в том числе и с методом опорных векторов».



О решении второй задачи и работы системы в целом читайте в статье

https://rb.ru/opinion/big-brother-is-studying-you/