Машинное обучение (нейросети) - это совсем не ядерная бомба.
В прошлом посте я решил обозначить миф, который часто встречается на просторах интернета: о том, что якобы нейросети создадут такую ситуацию, что начнут самообучаться, стремительно становиться все более эффективными и позволят своему владельцу захватить мир. С учетом того, что Китай на уровне правительственных программ очень серьезно вкладывается в развитие технологий машинного обучения, то картина становится совсем пугающей. Если вы, конечно, верите вбросам желтой прессы и оголтелым фантазерам.
Для начала, тем моим подписчикам, которые путаются в различиях между машинным обучением, нейросетями и искусственным интеллектом, я крайне рекомендую прочитать вот эту обзорную статью, а потом еще вот эту статью, чтобы понять применимость технологий на практике. А с более «прошаренными» подписчиками мы двинемся сразу дальше, к развенчиванию этого мифа.
Разобью свои размышления на пункты:
1. Мировая история отлично демонстрирует, что сохранить какие-либо технологии в тайне невозможно уже с 19 века. Как только вы достигаете каких-либо успехов в определенной сфере, тут же ваш конкурент/противник получает копию этого изобретения, или внедряет промышленных шпионов и получает ваши наработки. Мир глобализован, благодаря интернету информация передается между континентами моментально. Возьмем все тот же пример с ядерной бомбой: Манхэттенский проект был начат по факту с началом Второй мировой войны, тогда СССР даже и не помышлял о создании собственной бомбы. В 1945 году американцы уже взрывают Хиросиму, а у советов по-прежнему нет даже прототипа. В результате, благодаря шпионажу и вбухиванию в отрасль баснословных денег, СССР уже через 4 года делает свою первую атомную бомбу. Может показаться, что 4 года не так уж мало. С другой стороны, для столь сложной технологии это колоссально короткий срок.
2. В технологиях нейросетей и ядерной физике есть одно общее свойство - в них первичны не математические формулы, методы и технологические открытия. Ведь их запросто можно украсть и передать куда нужно. Гораздо важнее здесь исходный материал. В ядерной физике это уран, плутоний и тяжелая вода, а в машинном обучении - достаточно большая и достоверная выборка данных, которая чаще всего нужна еще и в реальном времени. Шпион вполне может выкрасть схему реактора, а вот вывезти 500 кг обогащенного урана будет сложновато. Точно так же, как организовать стриминг терабайт или даже петабайт данных в реальном времени у конкурента.
Так вот, обобщая этот пункт важно понять, что успехи в машинном обучении - это в первую очередь инвестиции в системы сбора достоверных данных, организацию их хранения и быстрой обработки. Но проблема в том, что никто не допустит китайцев к сбору данных о жителях, бизнесе и обороне США или Европы. Точно так же, как китайцы никого не пускают к своим данным. Поэтому все успехи, достигаемые в Китае на этом поприще, чаще всего будут применимы только в китайской экономике. А вот алгоритмы, которые будут развиваться вследствие этой работы, будут достаточно быстро становиться общедоступными.
Резюме:
Вероятно, Китай достигнет неких успехов в ML (machine learning) и подстегнет свой ВВП. Но важно понимать, что никто не позволит им собирать данные европейцев и американцев из-за стратегических опасностей. В итоге китайцы будут снабжать передовыми разработками в сфере ML весь остальной мир за деньги китайских налогоплательщиков.
Да и как показывает практика, все эти «мегастройки» в конечном счете оказываются экономически неэффективными велосипедами. Вспомнить хотя бы совсем недавный опыт японцев с компьютером пятого поколения.
В прошлом посте я решил обозначить миф, который часто встречается на просторах интернета: о том, что якобы нейросети создадут такую ситуацию, что начнут самообучаться, стремительно становиться все более эффективными и позволят своему владельцу захватить мир. С учетом того, что Китай на уровне правительственных программ очень серьезно вкладывается в развитие технологий машинного обучения, то картина становится совсем пугающей. Если вы, конечно, верите вбросам желтой прессы и оголтелым фантазерам.
Для начала, тем моим подписчикам, которые путаются в различиях между машинным обучением, нейросетями и искусственным интеллектом, я крайне рекомендую прочитать вот эту обзорную статью, а потом еще вот эту статью, чтобы понять применимость технологий на практике. А с более «прошаренными» подписчиками мы двинемся сразу дальше, к развенчиванию этого мифа.
Разобью свои размышления на пункты:
1. Мировая история отлично демонстрирует, что сохранить какие-либо технологии в тайне невозможно уже с 19 века. Как только вы достигаете каких-либо успехов в определенной сфере, тут же ваш конкурент/противник получает копию этого изобретения, или внедряет промышленных шпионов и получает ваши наработки. Мир глобализован, благодаря интернету информация передается между континентами моментально. Возьмем все тот же пример с ядерной бомбой: Манхэттенский проект был начат по факту с началом Второй мировой войны, тогда СССР даже и не помышлял о создании собственной бомбы. В 1945 году американцы уже взрывают Хиросиму, а у советов по-прежнему нет даже прототипа. В результате, благодаря шпионажу и вбухиванию в отрасль баснословных денег, СССР уже через 4 года делает свою первую атомную бомбу. Может показаться, что 4 года не так уж мало. С другой стороны, для столь сложной технологии это колоссально короткий срок.
2. В технологиях нейросетей и ядерной физике есть одно общее свойство - в них первичны не математические формулы, методы и технологические открытия. Ведь их запросто можно украсть и передать куда нужно. Гораздо важнее здесь исходный материал. В ядерной физике это уран, плутоний и тяжелая вода, а в машинном обучении - достаточно большая и достоверная выборка данных, которая чаще всего нужна еще и в реальном времени. Шпион вполне может выкрасть схему реактора, а вот вывезти 500 кг обогащенного урана будет сложновато. Точно так же, как организовать стриминг терабайт или даже петабайт данных в реальном времени у конкурента.
Так вот, обобщая этот пункт важно понять, что успехи в машинном обучении - это в первую очередь инвестиции в системы сбора достоверных данных, организацию их хранения и быстрой обработки. Но проблема в том, что никто не допустит китайцев к сбору данных о жителях, бизнесе и обороне США или Европы. Точно так же, как китайцы никого не пускают к своим данным. Поэтому все успехи, достигаемые в Китае на этом поприще, чаще всего будут применимы только в китайской экономике. А вот алгоритмы, которые будут развиваться вследствие этой работы, будут достаточно быстро становиться общедоступными.
Резюме:
Вероятно, Китай достигнет неких успехов в ML (machine learning) и подстегнет свой ВВП. Но важно понимать, что никто не позволит им собирать данные европейцев и американцев из-за стратегических опасностей. В итоге китайцы будут снабжать передовыми разработками в сфере ML весь остальной мир за деньги китайских налогоплательщиков.
Да и как показывает практика, все эти «мегастройки» в конечном счете оказываются экономически неэффективными велосипедами. Вспомнить хотя бы совсем недавный опыт японцев с компьютером пятого поколения.