SQL для аналитика



Зачастую (всегда) данные хранятся в базах данных. По сути, это набор таблиц, которые связаны между собой. Например, таблица customer (информация по пользователям) связана с таблицей payment (информация по оплате) через customer_id. Стоит отметить, что id в таблице customer - первичный ключ (основной) идет к внешнему ключу в таблице payment. Пользователь, сам по себе, в таблице уникальный, однако в таблице payment может встречаться несколько раз.



Спросите, почему мы не можем работать только с таблицей payment? Не факт, что пользователь вообще совершал заказ, однако в таблице customer_id он может быть.



Что часто просят на различных позициях?



1. Уметь писать простые запросы (JOIN, агрегирующие функции, подзапросы)

2. Оконные и другие функции.



Почему нельзя ограничиться одним Python?



1. Не всегда вам будут выгружать информацию в удобном для нас формате (csv, excel, txt).

2. Для выгрузки всей БД не будет хватать ресурсов.