
Исследователи создали опенсорс-конкурента о1 всего за $50.
Модель s1 обучили с помощью дистилляции — на ответах Gemini 2.0 Flash Thinking. В качестве основы выступила китайская Qwen2.5.
По словам исследователей, s1 обгоняет o1-preview в математике и программировании, а процесс ее обучения занял всего 26 минут. Код модели доступен тут.
@typespace
Модель s1 обучили с помощью дистилляции — на ответах Gemini 2.0 Flash Thinking. В качестве основы выступила китайская Qwen2.5.
По словам исследователей, s1 обгоняет o1-preview в математике и программировании, а процесс ее обучения занял всего 26 минут. Код модели доступен тут.
@typespace