Transformer-OCR — нейросетевая модель, которую обучили распознавать надписи на изображениях. Модель обходит существующие state-of-the-art методы на 5 датасетах. Transformer-OCR состоит из двух модулей: модуль для извлечения признаков из входного изображения и модуль с трансформером, который принимает на вход карты признаков.



https://bit.ly/3brpgba