📚Distributed Machine Learning with PySpark: Migrating Effortlessly from Pandas and Scikit-Learn (2024)



✍️Автор: Abdelaziz Testas



📃Страниц: 315



Книга предлагает план действий специалистам по обработке данных, рассматривающим возможность перехода от небольших библиотек данных (pandas/scikit-learn) к обработке больших объемов данных и машинному обучению с помощью PySpark. Вы научитесь переводить код на Python из pandas/scikit-научитесь использовать PySpark для предварительной обработки больших объемов данных и создания, обучения, тестирования и оценки популярных алгоритмов машинного обучения, таких как линейная и логистическая регрессия, деревья решений, случайные леса, методы опорных векторов, наивный Байесовский подход и нейронные сети.



Скачать книгу