Experimental chill

https://arxiv.org/pdf/2301.02432.pdf

Myths and Legends in High-Performance Computing

Статья хоть немного странно выглядит в качестве научной статьи, но достаточно интересно описывает то, какие мифы и легенды в High Performance Computing существуют.

Миф 1: Квантовые вычисления вытеснят HPC!

Миф 2: Мир захватит deep learning!

Миф 3: Сугубо точная специализация железа, как в смартфонах, позволит выйти за рамки закона Мура!

Миф 4: Все будет работать на каком-то ускорителе! (FPGA)

Миф 5: Программируемые железки дадут вам 100-кратное ускорение!

Миф 6: Скоро мы будем работать на Zettascale!

Миф 7: Системам следующего поколения нужно больше памяти на ядро!

Миф 8: Мы будем разъединять ресурсы из материнской платы (a.k.a стойки только с памятью, только с дисками и тд)

Миф 9: Приложения продолжают улучшаться. Даже на старом оборудовании!

Миф 10: Фортран мертв, да здравствует DSL!

Миф 11: HPC перейдет к низкой или смешанной точности!

Миф 12: Все высокопроизводительные вычисления будут поглощены Clouds!

Я со многим здесь согласен, и аргументы там очень хорошие. Наверное, я больше всего не согласен с пунктами 5, 9. Всё таки я считаю, что следующий скачок вычислений за изменением модели вычислений и за оптимизациями в софте -- другие алгоритмы и тд. Но всё ещё думаю, что до квантовых вычислений на огромных масштабах нам далеко. А вот то, где я заблуждался, пока не проникся темой, так это пункт 7.

Много приводят аргумент, что код как-то переписывать не ахти люди хотят. В целом я не вижу, что это правда, важные куски, если на них кто-то смотрит, постоянно оптимизруются. Важные куски в трейдинге тоже на FPGA и пока у нас нет совсем плохой истории софта важных систем, мы будем их улучшать. Новые алгоритмы выходят и даже их аргумент



However, we have to be cautious that—

just as hardware improvements have physics and engineering

limits—the “Algorithmic Moore’s Law” also has its own

limits: numerical stability, hitting asymptotic limits, etc. That

being said, those limits might not be as clear and quantifiable

as the limits on hardware. That is since even if one numerical

method hits its limit, domain experts can often reduce/precondition their problem to another numerical method that is

more efficient.

выглядит недостаточно происследованным. Негативные результаты в алгоритмической теории очень сложны. И если мы сможем положить много задач на SIMD или избавиться от перекладываний данных, чтобы не упираться в memory wall, изменения будут происходить и происходят -- SIMDJSON, лучшие базы данных, лучше компрессоры, лучше кеши и так далее. Ускорений в 1024x я не жду, но честно верю, что любой текущий софт можно раз в 5-6 ускорить, к сожалению, что-то оптимальное не очень человечное -- SIMDJSON невозможно читать, например.