🛠 PCA - метод главных компонент



Иногда признаки в датасете довольно сильно зависят друг от друга, и их одновременное наличие избыточно. В таком случае можно выразить несколько признаков через один, и работать уже с более простой моделью.



Конечно, избежать потерь информации, скорее всего, не удастся, но минимизировать ее поможет метод PCA.



Чтобы понять, как он работает, можно посмотреть видео от StatQuest:

[ENG] PCA Main Ideas in only 5 min - для тех, кто хочет вспомнить/понять основные идеи PCA

[ENG] PCA Step-by-Step - тут метод главных компонент разбирается подробнее

[ENG] 3 Practical Tips for PCA - прикладные советы по использованию PCA



Почитать про PCA можно в хендбуке от Яндекса, тут же можно посмотреть, как это все выглядит в Python



А если вам нужна сложная теория, можно почитать вот эту статью про PCA. Она хоть и немного старовата, но все равно дает хорошую теоретическую базу 🤓



И если дочитали до конца, обязательно ставьте сердечки ❤️ на этот пост)!