Делюсь с вами подборкой от коллег data engineers супер книгами - это основа мире инженерии, особенно если только начал свой путь, да и вообще это библия дата инженера короче.

1. Designing Data-Intensive Applications

https://www.amazon.com/Designing-Data-Intensive-Applications-Reliable-Maintainable/dp/1449373321



Также есть на русском: Высоконагруженные приложения Мартин Клеппман



Ну и от сердца отрываю для более прокаченных

2. Streaming Data: Understanding the Real-time Pipeline by Andrew Psaltis

https://www.amazon.com/Streaming-Data-Understanding-real-time-pipeline/dp/1617292281



На русском: Эндрю Пселтис: Потоковая обработка данных https://www.labirint.ru/books/634264/