🔗 Базовая теория по DL, которую должен знать каждый



👨‍💻 Умение строить нейронные сети и понимать, как они работают, является обязательным навыком практически для любого ML-специалиста. Поэтому разберем основные структурные компоненты нейронных сетей.



1️⃣ Искусственный нейрон

Нейрон, Входы (X), Веса (Weights), Смещение (Bias) и Функция активации.

Схему искусственного нейрона и его частей можете изучить тут.



2️⃣ Слои нейронной сети

Слои, виды слоёв (входной слой, скрытый слой, выходной слой) и функциональности
(линейный слой, сверточный слой, рекурентный слой).

Про эти и другие наиболее распространенные виды слоев читайте тут. Также изучаем схему простой нейронной сети (перцептрона), про сложность - читаем тут.



3️⃣ Функции активации

Наиболее популярными функциями активаций являются: Sigmoid, Tanh, ReLU, Softmax.

Про эти и другие функции активации читайте тут.



4️⃣ Слои нормализации

Проблема взрыва и затухания градиента.

Основные виды нормализаций активаций в нейронной сети: LayerNorm, BatchNorm, RMSNorm. О каждом более подробно читайте тут.



5️⃣ Dropout и Attention слои

О способе решения проблемы переобучения с Dropout читайте тут.

Attention-механизм
стал наиболее популярным в моделях Transformer, позволяя нейронной сети «фокусироваться» на важных частях входного сигнала через attention-score. Подробно о самом механизме читайте тут.



📚 Дополнительно читаем и преисполняемся:

- Наш большой справочник по Deep Learning

- Серия постов с видео по нейронным сетям - [Ч.1], [Ч.2]

- Доступный курс для каждого новичка по основам нейронных сетей

- Пишем свой нейрон на Python: практика для любого уровня

- Основы нейронных сетей с интересным разбором разных тем

- Математика, лежащая в основе нейронных сетей: серия простых статей



Обязательно ставьте ❤️ и 🔥 за наш труд!

Пишите комментарии и задавайте вопросы!

До встречи👋