
SQL для аналитика
Зачастую (всегда) данные хранятся в базах данных. По сути, это набор таблиц, которые связаны между собой. Например, таблица customer (информация по пользователям) связана с таблицей payment (информация по оплате) через customer_id. Стоит отметить, что id в таблице customer - первичный ключ (основной) идет к внешнему ключу в таблице payment. Пользователь, сам по себе, в таблице уникальный, однако в таблице payment может встречаться несколько раз.
Спросите, почему мы не можем работать только с таблицей payment? Не факт, что пользователь вообще совершал заказ, однако в таблице customer_id он может быть.
Что часто просят на различных позициях?
1. Уметь писать простые запросы (JOIN, агрегирующие функции, подзапросы)
2. Оконные и другие функции.
Почему нельзя ограничиться одним Python?
1. Не всегда вам будут выгружать информацию в удобном для нас формате (csv, excel, txt).
2. Для выгрузки всей БД не будет хватать ресурсов.
Зачастую (всегда) данные хранятся в базах данных. По сути, это набор таблиц, которые связаны между собой. Например, таблица customer (информация по пользователям) связана с таблицей payment (информация по оплате) через customer_id. Стоит отметить, что id в таблице customer - первичный ключ (основной) идет к внешнему ключу в таблице payment. Пользователь, сам по себе, в таблице уникальный, однако в таблице payment может встречаться несколько раз.
Спросите, почему мы не можем работать только с таблицей payment? Не факт, что пользователь вообще совершал заказ, однако в таблице customer_id он может быть.
Что часто просят на различных позициях?
1. Уметь писать простые запросы (JOIN, агрегирующие функции, подзапросы)
2. Оконные и другие функции.
Почему нельзя ограничиться одним Python?
1. Не всегда вам будут выгружать информацию в удобном для нас формате (csv, excel, txt).
2. Для выгрузки всей БД не будет хватать ресурсов.