ТГХаб
Каналы
Сиолошная
модель не то что смотрит на картинки, но и спокойно воспринимает мелкий текст. Ещё не дошел до этого, но подозреваю, что на OCR (распознавание) отдельно не учили