
🚀🧙🏼♂️Представляем OpenHermesPreferences: крупнейший открытый набор данных для RLHF и DPO
OpenHermesPreferences - это набор данных из ~1 миллиона прдпочтений ИИ, полученных из его ответов.
Датасет объединяет ответы от моделей,
https://huggingface.co/datasets/argilla/OpenHermesPreferences
OpenHermesPreferences - это набор данных из ~1 миллиона прдпочтений ИИ, полученных из его ответов.
Датасет объединяет ответы от моделей,
Mixtral-8x7B-Instruct-v0.1 и Nous-Hermes-2-Yi-34B.
https://huggingface.co/datasets/argilla/OpenHermesPreferences