📚 Книги для специалистов, работающих с Big Data



Аналитику Big Data нужно быть одновременно математиком, программистом и специалистом по работе с БД. Кроме технических знаний важно также иметь и коммуникативные навыки, и аналитические способности, чтобы не только получить результаты, но и обосновать их для бизнеса. В прокачке любых навыков особое место занимают крутые проекты и книги. Про некоторые полезные книги для всех, кто работает с большими данными, расскажем в этом посте. В том числе для новичков и неспециалистов.



«Теоретический минимум по Big Data», Анналин Ын и Кеннет Су, 2022 год



Эта книга с большим количеством иллюстраций позволит разобраться в основах стремительно развивающейся отрасли обработки больших данных. Каждому алгоритму посвящена глава, в которой не только объясняются основные принципы работы, но и даются примеры использования в реальных задачах. Книга для неспециалистов, без математики.



«Big Data. Вся технология в одной книге», Андреас Вайгенд, 2021 год



Автор этой книги — один из мировых гуру в области Big Data, директор компании Social Data Lab и в прошлом руководитель направления больших данных в Amazon. Андреас Вайгенд много знает о том, как с помощью больших данных инновационные компании следят за поведением пользователей, определяют круг интересов человека, управляют репутацией и формируют мнение потребителей. Об этом и рассказывает понятным для новичков языком на реальных примерах.



«Укрощение больших данных. Как извлекать знания из массивов информации с помощью глубокой аналитики», Билл Фрэнкс, 2014 год



Из книги Билла Фрэнкса вы узнаете, что такое большие данные, каково их значение, каковы методы, технологии и принципы новейшей аналитики. Автор также рассказывает, как это повлияет на последующее развитие бизнеса. Материал подробный, четко структурированный, изложенный простым языком. Кому покажется мало, а также для управленцев в технологических компаниях, можем посоветовать еще одну книгу Билла Фрэнкса — «Революция в аналитике. Как в эпоху Big Data улучшить ваш бизнес с помощью операционной аналитики».



«Python: Искусственный интеллект, большие данные и облачные вычисления», Дейтел Харви и Дейтел Пол, 2022 год



Python — один из самых популярных языков, используемых в анализе данных. Книга предлагает на практике познакомиться с различными библиотеками Python, которые используются для решения задач, связанных с ИИ, ML и большими данными, а также такими инструментами как Hadoop и Spark. Чтобы взяться за книгу, неплохо будет знать Python на хорошем уровне.



«Spark для профессионалов: современные паттерны обработки больших данных» Сэнди Риза, Ури Лезерсон, Шон Оуэн и Джош Уиллс, 2017 год



Здесь описываются паттерны для выполнения крупномасштабного анализа данных при помощи Spark. Авторы комплексно рассматривают Spark, статистические методы и множества данных, собранные в реальных условиях. На этих примерах демонстрируются решения распространенных аналитических проблем.



«Работа с BigData в облаках. Обработка и хранение данных с примерами из Microsoft Azure», Сенько Александр, 2019 год



В этой книге для уже разработчиков с опытом рассматриваются все этапы работы с большими данными в Microsoft Azure и AWS: получение данных, подготовленных для обработки в облаке, использование облачных хранилищ и облачных инструментов анализа данных. Книга также поможет освоить Azure, Docker и другие современные технологии.