Ищу добровольца-студента, кто бесплатно запилит простейшую текстовую многоклассовую классификацию.



Задача: По названию места определить его категорию: ресторан / парк / магазин / … .

Training set: ~3M строк с названием места и правильными ответами

Test set: ~2M строк без правильных ответов

Validation: руками проверить через гуглкарты, что +- норм



Примеры:

Рыболовная База «Клевое место» — ДОСУГ

Quiango, Uige, Angola — ПРИРОДА (река)

Vähä Petäjäjärvi - ПРИРОДА (озеро)

Ross Lake National Recreation Area - ПАРК

Weihnachtsmarkt Elmshorn - МАГАЗИН

Golden Caffè - РЕСТОРАН

Bäckerei Konditorei Plank Gmb - РЕСТОРАН



Могу сделать сам, но если кто-то хочет прикоснуться на практике к реальным и грязным данным - пишите в личку. Добавьте сразу, как бы вы решали эту задачу, почему это интересно и что из похожего уже делали. @okhlopkov.