➡️ Задание СКБ Контур



В Контуре есть 4 продукта для ритейла и товарного учета:



Контур.Ритейл

Контур.Поставки

Контур.Маркет

Контур.ОФД

Во всех этих продуктах идет работа с товарами. Мы хотим, чтобы с товарами было удобно работать:



названия были понятными и читаемыми

удобные классификаторы, с помощью которых можно выбирать один или множество товаров:

категория товара (чай, творог, и др.)

объем/вес/количество товара в упаковке

рецепт товара (провансаль, пломбир, и др.)

тип упаковки (банка, бутылка, коробка и др.)

В этом тестовом задании мы предлагаем вам попробовать решить одну из таких задач: классифицировать тип упаковки товара по его названию.



Формат входных данных



DataSet разделен на 2 части:



train - для обучения, в нем присутствует ID, название товара (name) и тип его упаковки (tare)



test - для оценки качества обученного вами классификатора, в нем присутствует только ID и название товара. Метрика качества, которая применяется для оценки: accuracy.

Формат решения



Требуется обучить модель на данных из train и предсказать тип упаковки для данных из test. В качестве результата мы ожидаем архив в виде “{Фамилия}_{Имя}.zip”, в котором будут 2 файла:



prediction.csv: предсказание для test в формате csv - id,tare

report.ipynb: jupyter notebook, где описан ход вашего решения от data exploration до построения предсказания для test.csv

Итоговый архив для проверки нужно было загрузить в гугл-форму.



⭐️ train

test

➡️ Решение



@machinelearning_interview