chatGPT наделал немало шума и вызвал волну хайпа. Инженерам не помешает понимать, как эта тема работает. А может даже и что-то "сделать" самим.
В этом посте набор базовых статей для Quick Start-а по BigScience Large Open-science Open-access Multilingual Language Model (Bloom). На этой "штуке"" можно создать свой LLM (аналог chatGPT).
Отсюда можно начать: https://huggingface.co/bigscience/bloom
Вот отличная статья про устройство (включая архитектуру) Bloom: «BLOOM: A 176B-Parameter Open-Access Multilingual
Language Model» https://arxiv.org/pdf/2211.05100.pdf
Вот крайне полезная статья для понимание возможностей, ограничений и границ применимости LLM: «Understanding the Capabilities, Limitations, and Societal Impact of Large Language Models» https://arxiv.org/pdf/2102.02503.pdf
Вот здесь немного на русском: https://habr.com/ru/company/first/blog/680750/
В этом посте набор базовых статей для Quick Start-а по BigScience Large Open-science Open-access Multilingual Language Model (Bloom). На этой "штуке"" можно создать свой LLM (аналог chatGPT).
Отсюда можно начать: https://huggingface.co/bigscience/bloom
Вот отличная статья про устройство (включая архитектуру) Bloom: «BLOOM: A 176B-Parameter Open-Access Multilingual
Language Model» https://arxiv.org/pdf/2211.05100.pdf
Вот крайне полезная статья для понимание возможностей, ограничений и границ применимости LLM: «Understanding the Capabilities, Limitations, and Societal Impact of Large Language Models» https://arxiv.org/pdf/2102.02503.pdf
Вот здесь немного на русском: https://habr.com/ru/company/first/blog/680750/