Привет! Ищем Data Engineer в Авиасейлс.



Мы запустили новый продукт Aviastats — это помощник в планировании маршрутов и управлении доходностью для авиакомпаний. Задача Aviastats — предоставлять авиакомпаниям и тревел-агентствам наши данные, чтобы они лучше понимали рынок.



Пока продукт вертится в одном DWH с аналитикой. Стек: Apache Impala + Redash + Python для ETL и оркестрации (Airflow не используем, самописная штука).

Интерес вакансии в том, что это DWH, который зарабатывает деньги напрямую, без длинной цепочки аналитиков/менеджеров/других команд.



Конкретные задачи будут зависеть от твоего опыта, но общее направление такое:

- развернуть отдельную инфраструктуру для нового продукта (сейчас база находится на общем аналитическом хранилище, а так как это сервис, который мы предоставляем другим компаниям, мы не хотим мешать его с нагрузкой от аналитики);

уйти с Impala из-за политики Cloudera;

- разработать API, которое позволит желающим компаниям плотнее интегрировать наши данные;

- помимо задач на классический DWH, есть задачи и на выведение ML в прод (например, модели на предсказание пассажиропотока).



У нас классно!

Здесь можно почитать более подробное описание: https://www.aviasales.ru/about/vacancies/2659667



А здесь о работе в Авиасейлс: https://www.aviasales.ru/about/work



Присылать резюме и задавать вопросы можно @tankiash