Почему у кота, чей хозяин — инженер из Amazon, есть персональный ИИ, а у нас — нет
Инженер из Amazon научился контролировать своего кота при помощи алгоритмов машинного зрения. Все, что ему потребовалось, — это камера Amazon DeepLens, микрокомпьютер Arduino и 23 тыс. изображений пушистого объекта. После идентификации животного система принимает решение, можно ли пускать ночного охотника домой: если тот вернулся с добычей в зубах, алгоритм блокирует дверцу на 15 минут и отправляет хозяину сообщение, если без улова — проход свободен.
Почему важно: Кажется, что парень сделал милую ML-игрушку для кота, но на деле он проделал кропотливую работу. Инженер собрал датасет из 23 тысячи изображений животного (с добычей и без) и натренировал сети с высоким процентом успеха — в 5 из 6 случаев ИИ верно среагировал на добычу.
Раз ИИ добрался до котов, то скоро и у нас будут подобные решения? К сожалению, нет. Рядовой пользователь не повторит опыт инженера: только на сбор и разметку данных уйдет тысяча долларов на той же Mturk. Благодаря скилам сотрудник Amazon выполнил типичную для B2B сегмента задачу — собрал работающее решение на основе машинного зрения. Если масштабировать его в B2C, то придется учить нейросеть различать все породы котов и их добычу — выйдет дорого и долго.
Это же задача более актуальна для бизнеса. Допустим — по контракту в пару сотен тысяч долларов вы создаете архитектуру, которая определяет активность сотрудников на заводе. Чтобы решение заработало на другом предприятии, ставите там камеры, пару недель собираете действия на записи, делаете разметку, дообучаете существующую нейросеть, и все работает. Получаете прибыль, результаты и востребованное решение на рынке.
Отсюда вывод — количество ИИ-кейсов с применением компьютерного зрения будет расти в B2B секторе, где есть заводы, а вот клиентам с лапками придется еще подождать.
Инженер из Amazon научился контролировать своего кота при помощи алгоритмов машинного зрения. Все, что ему потребовалось, — это камера Amazon DeepLens, микрокомпьютер Arduino и 23 тыс. изображений пушистого объекта. После идентификации животного система принимает решение, можно ли пускать ночного охотника домой: если тот вернулся с добычей в зубах, алгоритм блокирует дверцу на 15 минут и отправляет хозяину сообщение, если без улова — проход свободен.
Почему важно: Кажется, что парень сделал милую ML-игрушку для кота, но на деле он проделал кропотливую работу. Инженер собрал датасет из 23 тысячи изображений животного (с добычей и без) и натренировал сети с высоким процентом успеха — в 5 из 6 случаев ИИ верно среагировал на добычу.
Раз ИИ добрался до котов, то скоро и у нас будут подобные решения? К сожалению, нет. Рядовой пользователь не повторит опыт инженера: только на сбор и разметку данных уйдет тысяча долларов на той же Mturk. Благодаря скилам сотрудник Amazon выполнил типичную для B2B сегмента задачу — собрал работающее решение на основе машинного зрения. Если масштабировать его в B2C, то придется учить нейросеть различать все породы котов и их добычу — выйдет дорого и долго.
Это же задача более актуальна для бизнеса. Допустим — по контракту в пару сотен тысяч долларов вы создаете архитектуру, которая определяет активность сотрудников на заводе. Чтобы решение заработало на другом предприятии, ставите там камеры, пару недель собираете действия на записи, делаете разметку, дообучаете существующую нейросеть, и все работает. Получаете прибыль, результаты и востребованное решение на рынке.
Отсюда вывод — количество ИИ-кейсов с применением компьютерного зрения будет расти в B2B секторе, где есть заводы, а вот клиентам с лапками придется еще подождать.