Борис опять

#вакансия #москва #fulltime #анализданных

Привет!

Ищу разработчика Python с уклоном в data science в социальных науках в свою микрокоманду ☺️

Кто мы

Работа в ЦПУР, маленькой некоммерческой организации, которая занимается аудитом в госуправлении, проводит качественные и количественные политологические исследования в реальных условиях России и ратует за доказательную политику (то есть пытается сделать так, чтобы государственные решения основывались на эмпирических данных). Команда ЦПУРа когда-то отделилась от Центра стратегических разработок, у нас бывают совместные проекты с Вышкой, РЭШ, РАНХиГС.

Сейчас у нас есть проект "Инфраструктура научно-исследовательских данных" – это такая прослойка между государством и исследователями, для которой мы парсим госданные типа таможенных деклараций чиновников, текстов законопроектов, таблиц Росстата и тп – и делаем из них что-то нормальное, а иногда – и пилим свои исследования на этих данных. У нас есть ребята, которые пришли из социальных наук и сами научились анализу данных, но я ищу человека, который скорее наоборот – прогер/аналитик данных, но давно слушал Екатерину Шульман и всегда хотел приобщиться 😅

Что нужно делать

Скрепить всевозможные данные из всевозможных источников, парсить их, учинять над ними (exploratory) data analysis, отгружать в БД, поддерживать свежесть данных

Писать внутренние тулы для всего этого дела, а также коммитить в опенсорс свои скрипты по получению данных и исследованиям (красивые и с удобным интерфейсом)

Помогать мне повышать техническую культуру в команде, быть адептом регулярных кодревью, эффективного идиоматичного питон-кода, стайлгайдов, симпатичной визуализации данных и тп

Чего ждем

Опыт работы с Python от двух лет (в индустрии, академии или open source, значения не имеет);

Способность писать идиоматичный, эффективный и масштабируемый код, в частности – реализовывать простые удобные интерфейсы для публичного использования;

Знание и опыт работы с Git, jupyter, а также с pandas, sklearn, numpy, tensorflow, matplotlib и другими средствами разработки для анализа данных;

Базовые навыки по проектированию баз данных и SQL-запросам в PostgreSQL или других реляционных СУБД;

Опыт обработки данных объемом в несколько гигабайт в различных форматах (csv, xml, json и т.п.);

Желание обучаться и обучать других.

Будет плюсом: Опыт участия в open-source проектах; опыт участия в соревнованиях по машинному обучению на kaggle или на других площадках; навыки работы с командной строкой как в *nix, так и в Windows

Подробности

По умолчанию – полная рабочая неделя и Москва, но у нас есть ребята на удалёнке и неполной ставке, так что обсуждаемо

Вилка – 80-120к в месяц

Если заинтересовало, пишите мне в личку @sesame_open