
#nlp #big #news
🔥🔥🔥 Яндекс выложил YaLM 100B в открытый доступ
Внимание, только что в открытом доступе появилась самая большая генеративная сеть на русском языке.
Яндекс выложил веса своей YaLM 100B в открытый доступ!
• Модель основана на Megatron'e от Microsoft
• Для запуска понадобится кластер из GPU, например, 4 A100 на 80 Gb.
• Учили модель 65 дней на 800 A100 и 1.7 TB текстов.
GitHub
🔥🔥🔥 Яндекс выложил YaLM 100B в открытый доступ
Внимание, только что в открытом доступе появилась самая большая генеративная сеть на русском языке.
Яндекс выложил веса своей YaLM 100B в открытый доступ!
• Модель основана на Megatron'e от Microsoft
• Для запуска понадобится кластер из GPU, например, 4 A100 на 80 Gb.
• Учили модель 65 дней на 800 A100 и 1.7 TB текстов.
GitHub