NewSpace Times

🚀🧙🏼‍♂️Представляем OpenHermesPreferences: крупнейший открытый набор данных для RLHF и DPO

OpenHermesPreferences - это набор данных из ~1 миллиона прдпочтений ИИ, полученных из его ответов.

Датасет объединяет ответы от моделей, Mixtral-8x7B-Instruct-v0.1 и Nous-Hermes-2-Yi-34B.

https://huggingface.co/datasets/argilla/OpenHermesPreferences