https://medium.com/data-monzo/the-many-layers-of-data-lineage-2eb898709ad3



Да-да, каталоги и data lineage - моя больная тема.

А вот тут прекрасная статья нашлась, которая поясняет, что data lineage на деле, это не просто связь между колонками и таблицами, а нечно более. А именно несколько слоев: зависимость колонок, зависимость таблиц, зависимость на уровне моделей (ага, таблица != модель), зависимость на бизнес уровне.

И как только вы построили самый нижний слой (например, при помощи DBT), у вас появляется еще кучка новых вопросов.



@ohmydataengineer