
📚Data Engineering with Scala and Spark: A practical guide helping you build streaming and batch pipelines that process massive amounts of data using Scala (2024)
✍️ Автор: Eric Tome, David Radford, Rupam Bhattacharjee
📃 Страниц: 300
Эта книга научит вас, как использовать язык программирования Scala на платформе Spark и использовать новейшие облачные технологии для создания непрерывных и запускаемых конвейеров передачи данных. Вы сможете сделать это, создав среду разработки данных для локальной разработки и масштабируемого распределенного облачного развертывания с использованием передовых методов разработки данных, разработки на основе тестирования и CI/CD. Вы также познакомитесь с DataFrame API, Dataset API и Spark SQL API и их использованием. Также будут рассмотрены вопросы профилирования и качества данных в Scala, а также методы организации и настройки производительности ваших сквозных конвейеров для доставки данных конечным пользователям.
Скачать книгу
✍️ Автор: Eric Tome, David Radford, Rupam Bhattacharjee
📃 Страниц: 300
Эта книга научит вас, как использовать язык программирования Scala на платформе Spark и использовать новейшие облачные технологии для создания непрерывных и запускаемых конвейеров передачи данных. Вы сможете сделать это, создав среду разработки данных для локальной разработки и масштабируемого распределенного облачного развертывания с использованием передовых методов разработки данных, разработки на основе тестирования и CI/CD. Вы также познакомитесь с DataFrame API, Dataset API и Spark SQL API и их использованием. Также будут рассмотрены вопросы профилирования и качества данных в Scala, а также методы организации и настройки производительности ваших сквозных конвейеров для доставки данных конечным пользователям.
Скачать книгу