Российские учёные улучшили разработку карт глубины
Краем глаза слежу за научной конференцией о VR и AR, которая сейчас проходит в Сингапуре. Интересно вдвойне, потому что там ещё и участвуют исследователи из России. Вот, сотрудники Института AIRI представили крутую модель ИИ для построения карт глубины.
Что это за карты?
Карты глубины содержат информацию о расстоянии от точки обзора до поверхностей. Они нужны для ориентации в пространстве роботов и беспилотных авто.
Как их получают?
Обычно с помощью лидаров или RGB-камер. Хотя в обоих случаях есть ограничения, касающиеся радиуса действия.
Другой вариант — улучшать показания датчиков и прогнозов с помощью глубоких нейронок. Но и здесь есть сложности: приходится предварительно очищать исходные данные от шумов и помех.
В чём инновация?
Учёные объединили два подхода и разработали архитектуру с использованием глобальной пространственной информации. Она сочетает преимущества трансформеров и свёрточных архитектур.
При новом методе модели настраиваются с помощью самообучения. То есть данные датчиков глубины здесь вообще не нужны!
Что это даёт?
Упрощение обучения. А если точнее, процесс будет стоить значительно дешевле.
Метод уже проверили на независимых наборах данных. На конференции говорят, что модель показала одни из лучших в мире результатов.
Правда, научная статья еще не опубликована, но сборник конференции скоро выйдет, а в AIRI обещают выложить в открытый доступ модельки. Что ж, ждём.
Краем глаза слежу за научной конференцией о VR и AR, которая сейчас проходит в Сингапуре. Интересно вдвойне, потому что там ещё и участвуют исследователи из России. Вот, сотрудники Института AIRI представили крутую модель ИИ для построения карт глубины.
Что это за карты?
Карты глубины содержат информацию о расстоянии от точки обзора до поверхностей. Они нужны для ориентации в пространстве роботов и беспилотных авто.
Как их получают?
Обычно с помощью лидаров или RGB-камер. Хотя в обоих случаях есть ограничения, касающиеся радиуса действия.
Другой вариант — улучшать показания датчиков и прогнозов с помощью глубоких нейронок. Но и здесь есть сложности: приходится предварительно очищать исходные данные от шумов и помех.
В чём инновация?
Учёные объединили два подхода и разработали архитектуру с использованием глобальной пространственной информации. Она сочетает преимущества трансформеров и свёрточных архитектур.
При новом методе модели настраиваются с помощью самообучения. То есть данные датчиков глубины здесь вообще не нужны!
Что это даёт?
Упрощение обучения. А если точнее, процесс будет стоить значительно дешевле.
Метод уже проверили на независимых наборах данных. На конференции говорят, что модель показала одни из лучших в мире результатов.
Правда, научная статья еще не опубликована, но сборник конференции скоро выйдет, а в AIRI обещают выложить в открытый доступ модельки. Что ж, ждём.