#nlp #big #news



🔥🔥🔥 Яндекс выложил YaLM 100B в открытый доступ



Внимание, только что в открытом доступе появилась самая большая генеративная сеть на русском языке.



Яндекс выложил веса своей YaLM 100B в открытый доступ!



• Модель основана на Megatron'e от Microsoft

• Для запуска понадобится кластер из GPU, например, 4 A100 на 80 Gb.

• Учили модель 65 дней на 800 A100 и 1.7 TB текстов.



GitHub