День 2. Будущее искусственного интеллекта: OpenAI презентовала новое дообучение «рассуждающих» моделей! 💻



OpenAI представляет свою новейшую технологию — reinforcement fine-tuning (RFT) — которая позволит разработчикам самостоятельно дообучать модели o1 и o1-mini, превращая их в настоящих экспертов в узких областях. Всего за несколько десятков примеров вы сможете создать модель, умеющую решать сложные задачи!



🧬 Наглядным примером внедрения этой технологии стал биоинформатик Джастин Риз из Университета Беркли, который продемонстрировал, как o1-mini справляется с выявлением генов, ответственных за определенные заболевания. На основании дата-сета с описанием симптомов пациентов и связанных с ними генов, модель смогла не просто запомнить связи, а научиться компетентно рассуждать и делать точные предположения о нарушенных генах.



📊 Результаты впечатляют: дообученная o1-mini превзошла даже свою «старшую сестру» o1 в тестировании на контрольном датасете, что подтверждает эффективность нового подхода.



Эта методология открывает двери для создания экспертных моделей в таких областях, как экономика, право, медицина и множество других профессиональных сфер.



🚀 В настоящем времени RFT проходит бета-тестирование, и доступ к этой мощной технологии будет открыт пользователям в начале 2025 года. Это только второй из двенадцати «новогодних подарков» от OpenAI, и мы с нетерпением ждем следующих новостей!