
Исследователи начинают с того, что конструируют с помощью питоновской библиотеки art два датасета под названием Vision-in-Text Challenge:
1. ViTC-S: набор ASCII-артов с одной буквой, 36 классов (буквы и цифры), набранные артом в разных стилях, 8424 примера.
2. ViTC-L: Набор ASCII-артов с несколькими буквами, от двух до четырех в разных пропорциях, всего 8000 примеров (несколько можно увидеть на скриншоте).
Буквы набираются разными доступными в библиотеке стилями. Оба датасета доступны в официальном репозитории.
1. ViTC-S: набор ASCII-артов с одной буквой, 36 классов (буквы и цифры), набранные артом в разных стилях, 8424 примера.
2. ViTC-L: Набор ASCII-артов с несколькими буквами, от двух до четырех в разных пропорциях, всего 8000 примеров (несколько можно увидеть на скриншоте).
Буквы набираются разными доступными в библиотеке стилями. Оба датасета доступны в официальном репозитории.