Унижение с NVIDIA
#fail #interviews
Продолжаем марафон фэйлов. После десяти описанных уже накопился мини-батч, отдельно расскажу про NVIDIA. Это был не провал, а провал с треском. Не failed, а failed miserably.
Знакомство сразу типа «че, порох нюхал?» на чем DPO гоняешь? Как distributed model parallel делал? Не, не делал, только DDP? А, че 70b модели не трогал? Интервьюер китаец и очень вежливый, но вайб примерно такой.
Дальше неплохо. Трансформер, NLP, все дела. Архитектуру трансформера вообще почти все спрашивают. Правда, чел лихо делал отсылки ко всяким статьям типа Retro, начитанный. Но я вроде норм поддержал беседу.
Посыпался я на первом же вопросе про инжиниринг. В чем отличие хранения переменных в стэке от кучи? И как это связано с локальными/глобальными переменными? Я не то что забыл, думаю, я никогда даже не изучал это. Я вопрос-то распарсил со второго раза. Максимум мог промямлить, что стэк появляется при рекурсии.
И алгоритмы: задача «8 ферзей». Классика, 101, по словам интервьюера. Код писать не надо было, только решение описать. Но я что-то начал лепить то dynamic programming, то бэктрекинг. Хоть сложность факториальную правильно оценил, но все же четко не расписал решение с DFS. Думал это простая задача, база, а это хард.
На удивление, не сильно зацепило. Я знаю, что не хардкорный инженер. Гораздо хуже, когда все прекрасно и в последний момент обламывается.
А NVIDIA ищет единорогов, крутых и в рисече, и в инженерии. Могут себе позволить, в описании вакансии Senior Applied Scientist вилка для US 180-333k, и это только base. А акции все видели, потолок пробивают.
#fail #interviews
Продолжаем марафон фэйлов. После десяти описанных уже накопился мини-батч, отдельно расскажу про NVIDIA. Это был не провал, а провал с треском. Не failed, а failed miserably.
Знакомство сразу типа «че, порох нюхал?» на чем DPO гоняешь? Как distributed model parallel делал? Не, не делал, только DDP? А, че 70b модели не трогал? Интервьюер китаец и очень вежливый, но вайб примерно такой.
Дальше неплохо. Трансформер, NLP, все дела. Архитектуру трансформера вообще почти все спрашивают. Правда, чел лихо делал отсылки ко всяким статьям типа Retro, начитанный. Но я вроде норм поддержал беседу.
Посыпался я на первом же вопросе про инжиниринг. В чем отличие хранения переменных в стэке от кучи? И как это связано с локальными/глобальными переменными? Я не то что забыл, думаю, я никогда даже не изучал это. Я вопрос-то распарсил со второго раза. Максимум мог промямлить, что стэк появляется при рекурсии.
И алгоритмы: задача «8 ферзей». Классика, 101, по словам интервьюера. Код писать не надо было, только решение описать. Но я что-то начал лепить то dynamic programming, то бэктрекинг. Хоть сложность факториальную правильно оценил, но все же четко не расписал решение с DFS. Думал это простая задача, база, а это хард.
На удивление, не сильно зацепило. Я знаю, что не хардкорный инженер. Гораздо хуже, когда все прекрасно и в последний момент обламывается.
А NVIDIA ищет единорогов, крутых и в рисече, и в инженерии. Могут себе позволить, в описании вакансии Senior Applied Scientist вилка для US 180-333k, и это только base. А акции все видели, потолок пробивают.