Всем привет, в этом посте поделюсь задачами с различных собесов. Здесь буду кратко резюмировать то, что реально было на собесах, в тестовых заданиях 🧐



📦 OZON



👩‍💻 Задание на Python (pandas, numpy, знание функций, циклов, визуализаций, распределений)

> обработка данных

> агрегирующие функции

> удаление выбросов.

> визуализация



Например: нужно было сгенерировать user_id из цифр и букв длиной 15, при этом это должно экстраполироваться на 10000 строк 😏



👩‍💻 Задание на SQL (тетрис). Оконные функции, превращение «узкой» таблицы в «широкую», подзапросы, JOIN



Логика, тервер, стата, здравствуйте 💪



😀 Яндекс



📞 На первом созвоне с HR дали тервер для того, чтобы быстро понять, нужен ты им или нет.



Ну и вопрос на подумать:

Когда продавцу на Яндекс.Маркете выгодней всего продавать товар ниже себестоимости? Ответы пишите в комментариях 😬



📞 Второй созвон - теория вероятностей и математическая статистика. Поговорили про основные моменты, связанные с определением Sample Size через MDE, когда вариант A/B надо катить в прод и как выбрать систему сплитования, если на разработку даётся 2 дня. Если мы говорим про тервер, это типичные задачи на шарики с ящиками, условные вероятности, Байес и другие.



📞 Третий созвон -

алгоритмическая секция. Наводит ужас, не правда ли?



👩‍💻 Задача уровня LeetCode medium+



👩‍💻 Задача на оконные функции, не помню уже условия, но суть такая, что у нас есть таблица, которая имеет следующий вид:



id - int

time - int

value - varchar



Если мы видим пропуск в value (NULL) заполнить ненулевым значением, которое встречалось в партиции в сортированной таблице.



В конце поговорили про A/B тесты, различные сложности, которые могут возникать и другое.



🏦 Если вдруг решили устроиться 5/2 офис, мы вас ждём.



📞 Первый созвон



Больше про продуктовое мышление, дали кейс, по которому нужно было выбрать относительные метрики, как можно будет отдавать для разработки дешбордов.



📞 Второй созвон



👩‍💻 Из разряда, что выведет код, List comprehensions, функции, строки, словари. В библиотеки не залезали



👩‍💻 Какая ошибка в запросе, что выведет запрос



> нет группировки

> ошибка в JOIN и др.



Ну, конечно же, куда без тервера и шариков 😬



😶 Вывод:



Если хотите в Яндекс, решайте алгоритмические задачи на LeetCode, находите оптимальные решения, потому что зачастую спрашивают следующее: а можно как-то проще, чтобы сложность понизить? Не забываем про статистику и тервер, конечно же 😱



Если хотите в OZON, решайте более прикладные задачи, играйте с библиотеками, SQL, благо сейчас ресурсов тонны 🤤



Если хотите в Сбер, также решайте прикладные задачи, но не упарываясь в оптимизацию, также и с SQL 🫠



😍 В честь праздника, ловите небольшой подгон в виде самих заданий (часть из них удалось сохранить). Ссылка тут



Накидайте реакций, если понравился пост, и увидимся уже на митапе по ML в плешке (16 февраля) 💪