Работа с датасетами



Datasets — легкая и расширяемая библиотека для обмена и доступа к наборам данных (они же датасеты).



Наборы данных также предоставляют доступ к оценочным метрикам, предназначенных для того, что бы сообщество могло делиться новыми наборами данных.



Из плюсов библиотеки можно выделить следующее:



— Кэширование данных;

— Совместимость с NumPy, pandas, PyTorch, TenserFlow 2 и JAX;

— Все наборы данных отображаются в памяти.



Основные методы, которые понадобятся в работе с датасетами:



list_dataset() — показывает доступные датасеты;

load_dataset() — создает экземпляр датасета;

list_metrics() — показывает доступные метрики;

load_metric() — создает экземпляр метрики.



Много всего полезного об этой библиотеке вы можете найти в документации.



#Datasets