О теории игр для p2p сетей
Предлагаю посмотреть на интересные модели частных случаев самой популярной задачки из теории игр — Дилеммы заключенного. Внимательный читатель заметит, что описанные ниже модели один к одному симулируют поведение валидаторов в PoW и PoS сетях.
Модель 1: повторяемая Дилемма заключенного.
Правила
1. Алиса и Боб играют в игру n раз, для n ≥ 1
2. Счет каждого игрока это сумма его выигрышей за каждый раунд
3. Действие игрока на стадии i зависит от предыдущих исходов (от действий каждого игрока на стадии i - 1)
Интуитивным, но наивным ответом был бы вариант, что с течением игры возникнет кооперация, что позволит каждому игроку заработать больше очков.
Математическая модель, однако, выглядит следующим образом: сначала давайте подумаем о последнем шаге n. На нем не существует последующих раундов, следовательно нет никакого “наказания” за дачу показаний против друг друга. Следовательно, доминантой стратегией каждого игрока являет максимизация собственный очков и дача показаний против противника. На стадии n - 1 тоже нет никакой разницы как поведут себя игроки (на стадии n оба дадут обвинительные показания в любом случае). Поэтому так же доминантная стратегия для каждого игрока — дача показаний. Продолжая таким образом до шага 1, выясняется что доминантная стратегия для каждого шага это давать показания.
Вывод из задачи не таков, что кооперация в реальном мире каким-то образом иррациональна, а в том, что часто точной математической моделью доминантных стратегий в теории игр является иная, кроме самой очевидной модели.
Теперь небольшое задание для вас.
Модель 2: Дилемма заключенного со случайным количеством шагов
Правила
1. Алиса и Боб играют в игру
2. С вероятностью p игра останавливается. С вероятность 1 - p, игроки продолжают играть следующий раунд.
В этом примере так же события зависимы друг от друга. Предположим, игроки пытаются максимизировать свой выигрыш. Какая стратегия игры будет являться доминантой для них? Такая модель максимально приближена к реальности (мы никогда не знаем когда начнем и закончим учавствовать в некотором теоретикоигровом процессе, например, майнинге).
Предлагаю посмотреть на интересные модели частных случаев самой популярной задачки из теории игр — Дилеммы заключенного. Внимательный читатель заметит, что описанные ниже модели один к одному симулируют поведение валидаторов в PoW и PoS сетях.
Модель 1: повторяемая Дилемма заключенного.
Правила
1. Алиса и Боб играют в игру n раз, для n ≥ 1
2. Счет каждого игрока это сумма его выигрышей за каждый раунд
3. Действие игрока на стадии i зависит от предыдущих исходов (от действий каждого игрока на стадии i - 1)
Интуитивным, но наивным ответом был бы вариант, что с течением игры возникнет кооперация, что позволит каждому игроку заработать больше очков.
Математическая модель, однако, выглядит следующим образом: сначала давайте подумаем о последнем шаге n. На нем не существует последующих раундов, следовательно нет никакого “наказания” за дачу показаний против друг друга. Следовательно, доминантой стратегией каждого игрока являет максимизация собственный очков и дача показаний против противника. На стадии n - 1 тоже нет никакой разницы как поведут себя игроки (на стадии n оба дадут обвинительные показания в любом случае). Поэтому так же доминантная стратегия для каждого игрока — дача показаний. Продолжая таким образом до шага 1, выясняется что доминантная стратегия для каждого шага это давать показания.
Вывод из задачи не таков, что кооперация в реальном мире каким-то образом иррациональна, а в том, что часто точной математической моделью доминантных стратегий в теории игр является иная, кроме самой очевидной модели.
Теперь небольшое задание для вас.
Модель 2: Дилемма заключенного со случайным количеством шагов
Правила
1. Алиса и Боб играют в игру
2. С вероятностью p игра останавливается. С вероятность 1 - p, игроки продолжают играть следующий раунд.
В этом примере так же события зависимы друг от друга. Предположим, игроки пытаются максимизировать свой выигрыш. Какая стратегия игры будет являться доминантой для них? Такая модель максимально приближена к реальности (мы никогда не знаем когда начнем и закончим учавствовать в некотором теоретикоигровом процессе, например, майнинге).