Анализа данных с помощью SQL

Достаточно прикольный и полезный гайд по использованию SQL для анализа данных вместо Pandas.

Автор делится рядом любоптных идей: train/test split, линейная регрессия (оказывается, есть по умолчанию в PostgreSQL) и много других полезностей, собранных в одном месте, рекомендую!



Кстати, Mode когда-то тоже предлагали несколько изощренный способ построения регрессии с помощью SQL.



#link