Экзистенциально от событий накрывает, но жить дальше как-то надо
1. Я прочитал большинство статьей на FAST'22. В целом снова забавно, в прошлом году много разговаривали про Intel Optane и персистентность, но кажется поняли ошибку и приняли меньше в этом году.
Как я ожидал, конференции в 2022 будут более скучные, потому что работы делались в 2020-2021, в период пандемии. Из-за этого на конференции нет ничего из Google/Facebook/Amazon/Microsoft.
То, что понравилось на мой сугубо инженерный вкус
InfiniFS: An Efficient Metadata Service for Large-Scale Distributed Filesystems
Одно дело иметь скейл по данным, другое дело с какого-то момента начинаются проблемы с количеством метаданных в файловых системах. Статья показывает интересные решения как уменьшить боль через уменьшение нагрузки и упихать 100 миллиардов файлов без потери latency (спойлер, кэши, префетчи, правильная структура (мета)данных).
DedupSearch: Two-Phase Deduplication Aware Keyword Search
Милая и простая статья о проблеме, о которой я не думал серьезно: файлы в распределенных системах бьются на чанки, а чанки дедуплицируются. В статье рассматривают как сделать grep, чтобы не читать каждый чанк в файле, а искать внутри чанков и выплевывать результат наружу (спойлер: самые большие проблемы на стыках, поэтому строится минимальный индекс).
Hydra : Resilient and Highly Available Remote Memory
Статья показывает, как применить Erasure Code для распределенного контроля ответа на запрос на чтение из памяти (и из диска) небольшого количества данных (килобайты). Самая большая проблема -- если какая-то машина недоступна, приходится запрашивать много дополнительных чанков для восстановления. Статья пытается уменьшить этот фактор с помощью специальных матриц и балансировки. Занятно, если знать что такое Erasure Codes, но простовато, в Яндексе и Google такие технологии живут уже годами. Каждый год какие-то такие статьи появляются. Код, конечно же на чистом С и asm, как по-другому то в академии.
Best paper дали за софтверное исправление долгожительности жирных QLC SSD (сейчас в масс проде TLC (Triple Level Cells) с помощью специальных кодов, которые позволяют перезаписывать данные только поднимая напряжение. На практике работает не так красиво, но это нужный миру рисерч. Заслуженно. Сложно быть читать
FAST для меня стала отличной площадкой для прочтения статьей и подготовкой к дизайн интервью (хотя 3 года назад было тяжело читать).
Совет от меня: хватит почитывать смузи блоги на гитхабе, в статьях на конференциях намного больше знаний, они требуют усидчивости, да, но я буквально изучал системы по ним и безумно рад, что так делал и делаю. Они унижают, но это повод узнать что-то новое
2) Тут вышел Steam Deck и Valve просто с катушек слетела, фигачит патчи в protondb как не в себя, в неделю 10-15 новых игр становятся совместимыми с Linux. Судя по обзорам медиа, разработчики сами отвечают журналистам на все баги. Valve знают что делают, рад, что у них есть сила и мотивация тащить игровую индустрию на Linux. Захотелось самому покоммитить.
Много мыслей по поводу приватных компаний типа Valve, Telegram, Wikipedia. Все они тащат безумно интересные вещи, потому что им отчасти просто хочется. Как только ты на бирже, уже становится сложнее. Обществу нужны(?) такие компании, только мы пока не поняли как их обеспечивать. (Ну, Valve поняла худо бедно). Сложный капитализм...
3) Читая статьи, пытаясь писать код на работе, стал ловить себя, что мне все сложнее быть мотивированным. В Яндексе я сидел до 3 ночи дебагая какой-то баг в поиске, сейчас я едва сижу 4-5 продуктивных часов в день в Гугле. Платят в разы больше, и вроде бы даже все едет спокойно.
А запала такого нет. Все меньше желания сделать какую-нибудь прикольную штуку. Наверное, просто голова забита новостями...
Ну зато я вот поиграл в Sacred Gold на Linux через Proton. Моя первая игра на первом компе с Windows Vista, когда мне было 8 лет. Все ещё лучшая игра по моему мнению. Играл 3 месяца в детстве. Ностальгия lvl80, хочется бесконечно говорить о том как это было круто. Внутри порадовался тот маленький мальчик
1. Я прочитал большинство статьей на FAST'22. В целом снова забавно, в прошлом году много разговаривали про Intel Optane и персистентность, но кажется поняли ошибку и приняли меньше в этом году.
Как я ожидал, конференции в 2022 будут более скучные, потому что работы делались в 2020-2021, в период пандемии. Из-за этого на конференции нет ничего из Google/Facebook/Amazon/Microsoft.
То, что понравилось на мой сугубо инженерный вкус
InfiniFS: An Efficient Metadata Service for Large-Scale Distributed Filesystems
Одно дело иметь скейл по данным, другое дело с какого-то момента начинаются проблемы с количеством метаданных в файловых системах. Статья показывает интересные решения как уменьшить боль через уменьшение нагрузки и упихать 100 миллиардов файлов без потери latency (спойлер, кэши, префетчи, правильная структура (мета)данных).
DedupSearch: Two-Phase Deduplication Aware Keyword Search
Милая и простая статья о проблеме, о которой я не думал серьезно: файлы в распределенных системах бьются на чанки, а чанки дедуплицируются. В статье рассматривают как сделать grep, чтобы не читать каждый чанк в файле, а искать внутри чанков и выплевывать результат наружу (спойлер: самые большие проблемы на стыках, поэтому строится минимальный индекс).
Hydra : Resilient and Highly Available Remote Memory
Статья показывает, как применить Erasure Code для распределенного контроля ответа на запрос на чтение из памяти (и из диска) небольшого количества данных (килобайты). Самая большая проблема -- если какая-то машина недоступна, приходится запрашивать много дополнительных чанков для восстановления. Статья пытается уменьшить этот фактор с помощью специальных матриц и балансировки. Занятно, если знать что такое Erasure Codes, но простовато, в Яндексе и Google такие технологии живут уже годами. Каждый год какие-то такие статьи появляются. Код, конечно же на чистом С и asm, как по-другому то в академии.
Best paper дали за софтверное исправление долгожительности жирных QLC SSD (сейчас в масс проде TLC (Triple Level Cells) с помощью специальных кодов, которые позволяют перезаписывать данные только поднимая напряжение. На практике работает не так красиво, но это нужный миру рисерч. Заслуженно. Сложно быть читать
FAST для меня стала отличной площадкой для прочтения статьей и подготовкой к дизайн интервью (хотя 3 года назад было тяжело читать).
Совет от меня: хватит почитывать смузи блоги на гитхабе, в статьях на конференциях намного больше знаний, они требуют усидчивости, да, но я буквально изучал системы по ним и безумно рад, что так делал и делаю. Они унижают, но это повод узнать что-то новое
2) Тут вышел Steam Deck и Valve просто с катушек слетела, фигачит патчи в protondb как не в себя, в неделю 10-15 новых игр становятся совместимыми с Linux. Судя по обзорам медиа, разработчики сами отвечают журналистам на все баги. Valve знают что делают, рад, что у них есть сила и мотивация тащить игровую индустрию на Linux. Захотелось самому покоммитить.
Много мыслей по поводу приватных компаний типа Valve, Telegram, Wikipedia. Все они тащат безумно интересные вещи, потому что им отчасти просто хочется. Как только ты на бирже, уже становится сложнее. Обществу нужны(?) такие компании, только мы пока не поняли как их обеспечивать. (Ну, Valve поняла худо бедно). Сложный капитализм...
3) Читая статьи, пытаясь писать код на работе, стал ловить себя, что мне все сложнее быть мотивированным. В Яндексе я сидел до 3 ночи дебагая какой-то баг в поиске, сейчас я едва сижу 4-5 продуктивных часов в день в Гугле. Платят в разы больше, и вроде бы даже все едет спокойно.
А запала такого нет. Все меньше желания сделать какую-нибудь прикольную штуку. Наверное, просто голова забита новостями...
Ну зато я вот поиграл в Sacred Gold на Linux через Proton. Моя первая игра на первом компе с Windows Vista, когда мне было 8 лет. Все ещё лучшая игра по моему мнению. Играл 3 месяца в детстве. Ностальгия lvl80, хочется бесконечно говорить о том как это было круто. Внутри порадовался тот маленький мальчик