Всем привет!



Мы собрали большой диалоговый датасет (700 мб), с более 100 разными персонажами. Большая часть датасета сгенерировано gpt3.5turbo. Также данные включают в себя немного инструкций, и других тасков.



https://huggingface.co/datasets/SiberiaSoft/SiberianPersonaChat



Кроме того, мы затюнили на этом датасете Fred-T5, который доступен тут:



https://huggingface.co/SiberiaSoft/SiberianPersonaFred/



Фидбэк приветствуется!