
Позавчера в комментариях отвечал про варианты опен-сурсных ChatGPT, и что появится их несколько уже в ближайшие полгода.
И что я вижу сегодня? OpenChatKit
Сразу ссылка на демку на HF 🤗 (нужно принять правила перед использованием): тык.
Веса качать тут: бум.
Это затюненная на диалоги + инструкции модель GPT-NeoXT-20B, оценщиком которой была моделька на 6B параметров.
Датасет OIG (Open Instruction Generalist) содержит более 40 МИЛЛИОНОВ инструкций и диалогов, открытых по лицензии Apache-2.0. Это - результат коллаборации LAION (тех самых, которые заваривали датасеты для StableDiffusion), Together, и Ontocord.ai
Скрипты для тренировки (даже в 8 бит) и инференса - в наличии в репозитории.
В переводе на простой язык это означает: через 2-3 месяца будет ещё больший бум чатботов/ассистентов/etc. во всех местах. Прямо как было с SD, когда релизнули скрипты и веса с датасетами.
Всем бегом играться!
И что я вижу сегодня? OpenChatKit
Сразу ссылка на демку на HF 🤗 (нужно принять правила перед использованием): тык.
Веса качать тут: бум.
Это затюненная на диалоги + инструкции модель GPT-NeoXT-20B, оценщиком которой была моделька на 6B параметров.
Датасет OIG (Open Instruction Generalist) содержит более 40 МИЛЛИОНОВ инструкций и диалогов, открытых по лицензии Apache-2.0. Это - результат коллаборации LAION (тех самых, которые заваривали датасеты для StableDiffusion), Together, и Ontocord.ai
Скрипты для тренировки (даже в 8 бит) и инференса - в наличии в репозитории.
В переводе на простой язык это означает: через 2-3 месяца будет ещё больший бум чатботов/ассистентов/etc. во всех местах. Прямо как было с SD, когда релизнули скрипты и веса с датасетами.
Всем бегом играться!