chatGPT наделал немало шума и вызвал волну хайпа. Инженерам не помешает понимать, как эта тема работает. А может даже и что-то "сделать" самим.



В этом посте набор базовых статей для Quick Start-а по BigScience Large Open-science Open-access Multilingual Language Model (Bloom). На этой "штуке"" можно создать свой LLM (аналог chatGPT).



Отсюда можно начать: https://huggingface.co/bigscience/bloom



Вот отличная статья про устройство (включая архитектуру) Bloom: «BLOOM: A 176B-Parameter Open-Access Multilingual

Language Model» https://arxiv.org/pdf/2211.05100.pdf



Вот крайне полезная статья для понимание возможностей, ограничений и границ применимости LLM: «Understanding the Capabilities, Limitations, and Societal Impact of Large Language Models» https://arxiv.org/pdf/2102.02503.pdf



Вот здесь немного на русском: https://habr.com/ru/company/first/blog/680750/