SQL-запросы, о которых должен знать каждый дата-инженер. Гайд по по работе с SQL в Data Science.



Знание продвинутого синтаксиса SQL необходимо и новичку, и опытному дата-инженеру или аналитику данных.



В связи с бурным ростом объема данных все более важным становится умение очень быстро их анализировать
.



Объем данных на этом графике показан в зеттабайтах.



1 зеттабайт = 1 триллион гигабайтов

Есть много очень вместительных нереляционных хранилищ, которые отлично выполняют свою работу, поддерживая массовое горизонтальное масштабирование с низкими затратами. Однако они не заменяют высококачественные хранилища на основе SQL, а лишь дополняют их.



Высококачественными и очень надежными для относительно естественного моделирования данных их делают ACID-свойства SQL.



Читать дальше



@data_analysis_ml