Исследователи создали опенсорс-конкурента о1 всего за $50.



Модель s1 обучили с помощью дистилляции — на ответах Gemini 2.0 Flash Thinking. В качестве основы выступила китайская Qwen2.5.



По словам исследователей, s1 обгоняет o1-preview в математике и программировании, а процесс ее обучения занял всего 26 минут. Код модели доступен тут.



@typespace