📚Data Engineering with Scala and Spark: A practical guide helping you build streaming and batch pipelines that process massive amounts of data using Scala (2024)



✍️ Автор: Eric Tome, David Radford, Rupam Bhattacharjee



📃 Страниц: 300



Эта книга научит вас, как использовать язык программирования Scala на платформе Spark и использовать новейшие облачные технологии для создания непрерывных и запускаемых конвейеров передачи данных. Вы сможете сделать это, создав среду разработки данных для локальной разработки и масштабируемого распределенного облачного развертывания с использованием передовых методов разработки данных, разработки на основе тестирования и CI/CD. Вы также познакомитесь с DataFrame API, Dataset API и Spark SQL API и их использованием. Также будут рассмотрены вопросы профилирования и качества данных в Scala, а также методы организации и настройки производительности ваших сквозных конвейеров для доставки данных конечным пользователям.



Скачать книгу