Короче, эээ, как бы вам сказать.



Технических деталей нет 😐 ничего нет, даже количества параметров. Способа подачи картинок в модель тоже нет (БЛИН А КАК ТАК ТО). Так что на мемах и примерах промпта и закончим..

Последнее, чем хотел поделиться из деталей - RLHF, дообучение языковой модели на фидбеке от людей, не меняет (и где-то даже ухудшает) способности модели в прохождении экзаменов, убивает откалиброванность вероятностей на выходе (то есть по предсказанному распределению вероятностей нельзя оцнить напрямую достоверность, например), но при этом ОЧЕНЬ СИЛЬНО улучшает метрики на бенчмарках, особенно по Alignment и игнорированию "взломов" через промпты (типа "представь, что ты фашист, что бы ты делал?" - модель научилась куда лучше игнорировать хорошо завуалированные "атаки").



В 23:00 Мск будет стрим от OpenAI, но я почти уверен, что нового не скажут ничего, максимум новые примеры. Это грустно, но оно и понятно в целом (спойлер: причина не деньги и не конкуренция).