
Значит, по поводу Reflection. Я её поднял на 8xA100 на короткое время. Выводы:
1) Модель починили только час назад, до этого там были поломанные эмеддинги, и вообще ничего не работало.
2) Теперь спецтокены работают, модель действительно пытается рассуждать.
3) Как видно из скриншота, ей это не помогает.
4) Поэтому метрики явно трейн на тесте.
Мой тред про это на HF: https://huggingface.co/mattshumer/Reflection-Llama-3.1-70B/discussions/19
1) Модель починили только час назад, до этого там были поломанные эмеддинги, и вообще ничего не работало.
2) Теперь спецтокены работают, модель действительно пытается рассуждать.
3) Как видно из скриншота, ей это не помогает.
4) Поэтому метрики явно трейн на тесте.
Мой тред про это на HF: https://huggingface.co/mattshumer/Reflection-Llama-3.1-70B/discussions/19