Библиотека собеса по Data Science | вопросы с собеседований

Что такое alignment в языковых моделях?

Alignment в контексте ИИ означает процесс настройки модели таким образом, чтобы её ответы соответствовали этике, законам и ценностям общества.

Обычно alignment происходит во время файн-тюнинга. Процесс включает в себя два этапа:

▪️Фаза обучения на инструкциях.

На этой фазе LLM дают примеры целевых задач.

▪️Фаза оценки.

На этой фазе человек или другая модель взаимодействуют с LLM и оценивают её ответы в режиме реального времени. На этом этапе может использоваться обучение с подкреплением, чтобы внести фидбэк в знания исходной модели.

#NLP

#глубокое_обучение