
В профессиональной IT-среде обсуждается модель для распознавания рукописных цифр, основанная на MNIST. База данных MNIST включает в себя 60,000 изображений для обучения и 10,000 изображений для тестирования, составленных из обработанных чёрно-белых образцов NIST, дополненных образцами студентов американских университетов. Изображения нормализованы до 28x28 пикселей в серых тонах. Модель mnist.onnx из зоопарка моделей поддерживает opset 8, но не совместима с устаревшим opset 1. Примечательно, что выходной вектор модели не прошёл через Softmax, но это легко исправляется. Для распознавания цифр используется интерфейс с возможностью рисования мышью. Вероятности выводятся, если результат ниже 0.8, причём особенные сложности возникают с цифрой 9. Цифры с левым наклоном обрабатываются более уверенно.
Читать далее...
Читать далее...