#вакансия #москва #fulltime #анализданных
Привет!
Ищу разработчика Python с уклоном в data science в социальных науках в свою микрокоманду ☺️
Кто мы
Работа в ЦПУР, маленькой некоммерческой организации, которая занимается аудитом в госуправлении, проводит качественные и количественные политологические исследования в реальных условиях России и ратует за доказательную политику (то есть пытается сделать так, чтобы государственные решения основывались на эмпирических данных). Команда ЦПУРа когда-то отделилась от Центра стратегических разработок, у нас бывают совместные проекты с Вышкой, РЭШ, РАНХиГС.
Сейчас у нас есть проект "Инфраструктура научно-исследовательских данных" – это такая прослойка между государством и исследователями, для которой мы парсим госданные типа таможенных деклараций чиновников, текстов законопроектов, таблиц Росстата и тп – и делаем из них что-то нормальное, а иногда – и пилим свои исследования на этих данных. У нас есть ребята, которые пришли из социальных наук и сами научились анализу данных, но я ищу человека, который скорее наоборот – прогер/аналитик данных, но давно слушал Екатерину Шульман и всегда хотел приобщиться 😅
Что нужно делать
Скрепить всевозможные данные из всевозможных источников, парсить их, учинять над ними (exploratory) data analysis, отгружать в БД, поддерживать свежесть данных
Писать внутренние тулы для всего этого дела, а также коммитить в опенсорс свои скрипты по получению данных и исследованиям (красивые и с удобным интерфейсом)
Помогать мне повышать техническую культуру в команде, быть адептом регулярных кодревью, эффективного идиоматичного питон-кода, стайлгайдов, симпатичной визуализации данных и тп
Чего ждем
Опыт работы с Python от двух лет (в индустрии, академии или open source, значения не имеет);
Способность писать идиоматичный, эффективный и масштабируемый код, в частности – реализовывать простые удобные интерфейсы для публичного использования;
Знание и опыт работы с Git, jupyter, а также с pandas, sklearn, numpy, tensorflow, matplotlib и другими средствами разработки для анализа данных;
Базовые навыки по проектированию баз данных и SQL-запросам в PostgreSQL или других реляционных СУБД;
Опыт обработки данных объемом в несколько гигабайт в различных форматах (csv, xml, json и т.п.);
Желание обучаться и обучать других.
Будет плюсом: Опыт участия в open-source проектах; опыт участия в соревнованиях по машинному обучению на kaggle или на других площадках; навыки работы с командной строкой как в *nix, так и в Windows
Подробности
По умолчанию – полная рабочая неделя и Москва, но у нас есть ребята на удалёнке и неполной ставке, так что обсуждаемо
Вилка – 80-120к в месяц
Если заинтересовало, пишите мне в личку @sesame_open
Привет!
Ищу разработчика Python с уклоном в data science в социальных науках в свою микрокоманду ☺️
Кто мы
Работа в ЦПУР, маленькой некоммерческой организации, которая занимается аудитом в госуправлении, проводит качественные и количественные политологические исследования в реальных условиях России и ратует за доказательную политику (то есть пытается сделать так, чтобы государственные решения основывались на эмпирических данных). Команда ЦПУРа когда-то отделилась от Центра стратегических разработок, у нас бывают совместные проекты с Вышкой, РЭШ, РАНХиГС.
Сейчас у нас есть проект "Инфраструктура научно-исследовательских данных" – это такая прослойка между государством и исследователями, для которой мы парсим госданные типа таможенных деклараций чиновников, текстов законопроектов, таблиц Росстата и тп – и делаем из них что-то нормальное, а иногда – и пилим свои исследования на этих данных. У нас есть ребята, которые пришли из социальных наук и сами научились анализу данных, но я ищу человека, который скорее наоборот – прогер/аналитик данных, но давно слушал Екатерину Шульман и всегда хотел приобщиться 😅
Что нужно делать
Скрепить всевозможные данные из всевозможных источников, парсить их, учинять над ними (exploratory) data analysis, отгружать в БД, поддерживать свежесть данных
Писать внутренние тулы для всего этого дела, а также коммитить в опенсорс свои скрипты по получению данных и исследованиям (красивые и с удобным интерфейсом)
Помогать мне повышать техническую культуру в команде, быть адептом регулярных кодревью, эффективного идиоматичного питон-кода, стайлгайдов, симпатичной визуализации данных и тп
Чего ждем
Опыт работы с Python от двух лет (в индустрии, академии или open source, значения не имеет);
Способность писать идиоматичный, эффективный и масштабируемый код, в частности – реализовывать простые удобные интерфейсы для публичного использования;
Знание и опыт работы с Git, jupyter, а также с pandas, sklearn, numpy, tensorflow, matplotlib и другими средствами разработки для анализа данных;
Базовые навыки по проектированию баз данных и SQL-запросам в PostgreSQL или других реляционных СУБД;
Опыт обработки данных объемом в несколько гигабайт в различных форматах (csv, xml, json и т.п.);
Желание обучаться и обучать других.
Будет плюсом: Опыт участия в open-source проектах; опыт участия в соревнованиях по машинному обучению на kaggle или на других площадках; навыки работы с командной строкой как в *nix, так и в Windows
Подробности
По умолчанию – полная рабочая неделя и Москва, но у нас есть ребята на удалёнке и неполной ставке, так что обсуждаемо
Вилка – 80-120к в месяц
Если заинтересовало, пишите мне в личку @sesame_open