Что такое alignment в языковых моделях?



Alignment в контексте ИИ означает процесс настройки модели таким образом, чтобы её ответы соответствовали этике, законам и ценностям общества.



Обычно alignment происходит во время файн-тюнинга. Процесс включает в себя два этапа:

▪️Фаза обучения на инструкциях.

На этой фазе LLM дают примеры целевых задач.

▪️Фаза оценки.

На этой фазе человек или другая модель взаимодействуют с LLM и оценивают её ответы в режиме реального времени. На этом этапе может использоваться обучение с подкреплением, чтобы внести фидбэк в знания исходной модели.



#NLP

#глубокое_обучение