Нормальная форма игры
В теории игр, игра в нормальной или стратегической форме (англ. normal form) состоит из трех элементов: множества игроков, множества чистых стратегий каждого игрока, множества платежных функций каждого игрока. Таким образом, игру в нормальной форме можно представить в виде n-мерной матрицы (таблицы), элементы которой это n-мерные платежные вектора. Эта таблица называется платёжной матрицей (англ. payoff matrix).
Формальное определение
[править | править код]Игрой в нормальной форме называется тройка , где
- — множество игроков
- — множество множеств чистых стратегий каждого игрока,
- — множество функций платежей для каждого игрока.
У каждого игрока имеется конечный набор чистых стратегий и функция полезности (функция платежа) .
Исход игры — это комбинация чистых стратегий каждого игрока:
где .
Два игрока/две стратегии
[править | править код]Игрок 2 L |
Игрок 2 R | |
Игрок 1 U |
4, 3 | –1, –1 |
Игрок 1 D |
0, 0 | 3, 4 |
Нормальная форма для игры с 2 игроками, у каждого из которых по 2 стратегии. |
Случай двух игроков — двух чистых стратегий отображен на таблице. Чистые стратегии первого игрока: U и D. Чистые стратегии второго игрока: L и R. Если первый игрок выбирает U, а второй игрок (единовременно) выбирает L, то соответствующие платежи равны 4 и 3 (первый элемент вектора (4, 3) обозначает платеж первого игрока, а второй — платеж второго игрока в случае, если были выбраны стратегии U и L). То есть чтобы найти распределение платежей, соответствующих каждому набору сыгранных стратегий, необходимо просто найти вектор, находящийся на пересечении соответствующих рядов и колонок таблицы (ряды соответствуют стратегиям первого игрока, а колонки — стратегиям второго игрока). Сыгранная комбинация стратегий называется исходом игры. В данном примере исход игры (U, L). Все возможные исходы для этой игры: {(U, L), (U, R), (D, L), (D, R)}. Очевидно, каждая ячейка таблицы соответствует одному из возможных исходов.
Функция полезности
[править | править код]В общем случае предполагается, что игрок имеет предпочтения на множестве исходов. То есть для каждого игрока заданы бинарные ��тношения между элементами этого множества. Это значит, что игрок может сравнить любые два исхода: игрок или отдает предпочтение одному из двух исходов или остаться безразличным между обоими исходами. При определенных дополнительных предположениях относительно предпочтений игрока можно показать, что существует функция полезности Неймана-Монгенштерна представляющая полезность каждого исхода как действительное число u(s), при чём если u(s)≥u(s’) <=> игрок предпочитает (или безразличен) исход s исходу s’. В нашем примере первый игрок предпочитает исход (U, L) исходу (D, R) так как 4>3.
Игры с полной/неполной информацией
[править | править код]В играх с полной информацией описание игры известно всем игрокам (все игроки знают чистые стратегии и функции полезности всех остальных игроков). В играх с неполной информацией некоторые игроки могут не знать функции полезности других игроков (то есть не знать некоторые конкретные значения для ячеек таблицы из нашего примера).
Любая игра в экстенсивной форме может быть представлена игрой в нормальной форме (не обязательно эквивалентной). Представление игры в нормальной форме может быть использовано для нахождения доминируемых стратегий.
См. также
[править | править код]Литература
[править | править код]- Васин А. А., Морозов В. В. Теория игр и модели математической экономики. — М.: Макс-пресс, 2005. — 272 с. — ISBN 5-317-01388-7.
- Данилов В. И. Лекции по теории игр. — М.: РЭШ, 2002. — 140 с. : ил. ISBN 5-8211-0193-X
- Петросян Л. А., Зенкевич Н.А., Семина Е.А. Теория игр: Учебное пособие для университетов. — М.: Высш. шк., Книжный дом «Университет», 1998. — С. 304. — ISBN 5-06-001005-8, 5-8013-0007-4.