🚀Команда Сбера🚀выложила в open-source самый большой датасет, содержащий мультимодальные банковские данные ЮЛ.



🔥Multimodal Banking Dataset (MBD)🔥



Датасет состоит из обезличенных исторических данных, содержащих следующую информацию по клиентам ЮЛ за 12-24 месяцев:

📌транзакционная активность (transactions);

📌эмбеддинги диалогов (dialogs);

📌гео-активность (geostream).



Таргет: предсказать для каждого пользователя взятие каждого из четырех продуктов в течение месяца после отчетной даты. Исторические данные за 2022 находятся в targets.



Датасет на HuggingFace:



🖥https://huggingface.co/datasets/ai-lab/MBD (14,6 GB, основной датасет)

🖥https://huggingface.co/datasets/ai-lab/MBD-mini (3,38 GB, уменьшенная версия, 10% клиентов из основного датасета)



Датасет опубликован под лицензией Creative commons 4.0, доступен для использования в научных работах, экспериментах итд.