В последние пару месяцев идет масса новых статей по применению Трансформеров к ComputerVision. Попробовал систематизировать их и написать статью на Хабре что нового и откуда это все - https://habr.com/ru/company/recognitor/blog/553478/

А параллельно - видео, кому читать лень - https://youtu.be/xQFeeh5DqeY ;)