Получаем текст с картинки



У Google есть система Tesseract, которая позволяет парсить текст с картинок с помощью оптического распознавания символов.



И в качестве обертки над их системой, был создан пакет pytesseract, который максимально удобно и легко использовать.



Для того, чтобы получить текст с картинки, нужно вызвать метод image_to_string. Если вас интересует текст на русском, то следует указать аургмент lang как 'rus'.



Еще важно, что для открытия картинок рекомендуется использовать pillow, хоть и имеется возможность просто указать путь к файлу в виде строки.



#pytesseract