Эволюция моей оркестрации:



🥉 jupyter ноутбук

Запускаешь парсинг, пока на созвоне, смотришь кинчик или спишь.



Улучшения для покемона:

▪️Сохранять сразу в базу, а не локально

▪️Хостить жупутер на сервере, чтобы хоть с телефона можно было триггернуть задачку



🥈 Airflow

Крон на максималках, но нормально его задеплоить без полпинты нельзя. Проект древний, документации много и плохо. Если в вашей конторе он уже есть - кайф. Если вам нужно все это запустить с нуля — добро пожаловать в девопс.



🥇 Prefect

Тоже хрен разберешься, как нормально его задеплоить, ведь качество документации и тут тоже заряжено на генерацию лидов в enterprise вершн. Особенно это нетривиально через Dokku, которую я использую, чтобы особо не девопсить.



Но если завелось - ты будешь награжден. Просто пишешь в питоне функции, вешаешь декораторы и typing — и у тебя есть веб интерфейс к каждой функции. В отличие от Airflow, Prefect одобряет запуск неопределенного числа тасок (см скрин), что бывает часто, если ты парсишь.