Дата-инженеры и кому они нужны.

Валентин Гогичашвили, Zalando SE



Доклад отвечает на вопросы:

— Что нужно дата-саентистам, чтобы не терять 80% времени на борьбу с инструментами? Нужна платформа для работы с данными.

— Кто будет её делать? Специальные инженеры, но ни в коем случае не сами саентисты.

— Как её делать? Как обычный продукт: изучать потребителей, проверять гипотезы, доставлять небольшими итерациями. И как обычную платформу как сервис: использовать готовые инструменты, обмазать автоматизацией и метриками, обучать пользователей.



Беру пример с Максима Цепкова: постарался написать более связный текст, нашёл переводы почти всех терминов. https://github.com/NickVolynkin/highload-2018/blob/master/1.9-data-engineers.md.



#highload2018