А, чуть не забыл. Выложил собранные данные за пару недель в saiga_scored.

Все данные с бота можно получить по такому условию:



row["source"].startswith("saiga_bot")



Всего там где-то 2к диалогов и 50 чатов.

Моделька с этими данными учится (всё ещё на базе llama-3).



phi3-medium пока не впечатляюще лучше получается, неофициальный релиз тут.