Что такое Docker? Почему он нужен Data Scientist?



💻Начнем мы не просто с Docker, а с Jupyter Notebook. В каком то определённом смысле данный инструмент настолько проник в сознание многих Data Scientists, что слезть с него довольно тяжело. Потому что это действительно удобный инструмент, где вы можете визуализировать свои данные, работу и результаты алгоритма. Да и как правило не сильно кто-то заморачивается с написанием качественного и чистого кода. Но Jupyter Notebook он на то и notebook, что в переводе с английского «тетрадь», «блокнот». Это ваш черновик. И как правило такой код и ноутбук в принципе вы переиспользовать не сможете, вам придется заново копировать ваш код из ноутбука в ноутбук. Что уж говорить, если вы захотите использовать свою модель уже для реального процесса. Можно конечно заморочиться для production, но опять же повторюсь, встают проблемы с переиспользованием кода.



⚠️Плюс, даже если вы переписали свой ноутбук в питон модули на собственном компьютере, и дальше хотите запустить уже в производственный контур, то вам необходимо предусмотреть не только все зависимости (библиотеки, пакеты и так далее), но и разницу между вычислительной средой вашего компьютера, производственной платформой (prod) и тестовым контуром (test). Вот тут как раз могут начаться проблемы и танцы с бубнами.



🐳И чтобы согласовать все ваши среды, как раз и применяются необходимые для этого инструменты виртуализации, например, как Docker.



Поэтому переходим по ссылке в шапке профиля, в новом видео рассмотрены все аспекты выше в более детальном ключе, также мы с вами посмотрим как переписать наш ноутбук в питон модули на примере проекта, который уже был, ну и конечно развернем наше приложение при помощи Docker!



Помимо этого в видео будет анонс и ссылка на курсы по Python с промокодом на 30%😉



https://youtu.be/8AS-wTTfuQI