Прежде чем перейти к статье, хочу вам представить, экономическую онлайн игру Brave Knights, в которой вы можете играть и зарабатывать. Регистируйтесь, играйте и зарабатывайте!
Недавно, при просмотре неофициального онлайн-турнира по одной соревновательной игре, я ознакомился со следующим утверждением: для двух команд, равных по силе, т.е. когда исход матча моделируется броском симметричной бернуллиевской монетки, при игре в формате "до двух побед" вероятность счёта "в одни ворота", т.е. 2-0/0-2, равна вероятности счёта не "в одни ворота", т.е. 2-1/1-2. Это утверждение заставило меня вытащить из глубин памяти знания школьной комбинаторики и теорвера. Приведу небольшие заметки по данному вопросу.
Сценарий
Две команды — команда 0 и команда 1 — играют серию матчей. Результаты разных матчей серии являются независимыми случайными величинами со следующим распределением. Вероятность победы команды 0 в матче есть , вероятность победы команды 1 есть . Считаем что , т.е. ничьей быть не может.
Серия матчей играется в формате "first to ", т.е. до тех пор, пока некая команда не одержит побед в серии матчей. Формат "first to " (FT ) эквивалентен формату "best of " (BO ), где победитель определяется на основании серии матчей длины — если некая команда уже одержала побед, то её оппонент не может одержать более победы, т.е. не может выиграть.
Завершившуюся серию матчей можно представить в виде последовательности нулей и единиц, где на позиции означает, что матч под номером выиграла команда 0, а на позиции означает, что матч выиграла команда 1. Пример такой последовательности:
В данном примере команда 0 выиграла со счётом 4-2 в FT4/BO7. В дальнейшем для обозначения счёта будем также использовать запись следующего вида: , где есть число побед команды 0, а есть число побед команды 1. Т.е. счёт выше можно записать в виде . Любой счёт завершившейся серии матчей может быть представлен в виде в случае победы команды 0, и в случае победы команды 1, где . Заметим также что команда, победившая в серии матчей, обязана победить в последней игре серии, т.е. в случае победы команды 0 последовательность должна заканчиваться на , в случае победы команды 1 — на . Число нулей в последовательности есть число побед команды 0, число единиц в последовательности есть число побед команды 1.
Вероятность определённого счёта в серии матчей
Серия матчей между двумя командами, где в каждом матче результат (победа команды 0 или команды 1) является случайной величиной с указанными выше вероятностями, может быть моделирована как последовательность случайных величин, подчиняющихся распределению Бернулли. Если результаты отдельных матчей независимы, то вероятность выпадения последовательности есть произведение вероятностей отдельных элементов. К примеру, для рассмотренной выше последовательности вероятность именно такой серии матчей есть . Однако, одному и тому же счёту могут соответствовать разные серии матчей. К примеру, счёт может получиться из следующих серий:
Необходимо подсчитать общее число возможных серий для произвольного счёта.
В серии матчей для счёта вида (т.е. с победой команды 0) будет содержаться ровно нулей. Расставим единиц в последовательность из нулей. Для первой единицы есть ровно мест, в которые единицу можно поставить (так как последовательность должна заканчиваться нулём, а серия матчей — победой команды 0). Следующую единицу вставляем в последовательность из элементов, т.е. возможных мест для её постановки будет . Считая, что все вставляемые единицы уникальны, получаем
вариантов для вставки единиц в оригинальную последовательность из нулей. Вспомним теперь, что любая перестановка единиц не меняет получившуюся последовательность. Это значит, что результат необходимо поделить на число перестановок единиц, равное . Итого получаем:
Итоговая вероятность счёта есть .
Для счёта , аналогичным образом, вероятность есть .
Проверку условия нормировки
оставим читателю.
Результаты
Первым делом посмотрим просто на распределение с произвольно выбранными параметрами:
График получился асимметричным в силу того, что , максимум вероятности достигается для счёта 3-10, что вполне соответствует заданным вероятностям. Как кривые меняются при изменении вероятностей победы в матче?
Кажется, что вероятность некоторых счётов одинакова — к примеру, при вероятность для 0-10 и 1-10 не поменялась. Обратимся к выведенным ранее формулам. Вероятность счёта есть . Вероятность счёта есть . Т.е. вероятности оказываются одинаковыми при . Несмотря на то, что вероятность более длинной серии матчей для счёта меньше вероятности короткой серии матчей для счёта , за счёт увеличения числа серий матчей, при которых достигается счёт вероятность счёта равна вероятности счёта .
Для подобный эффект наблюдается уже при и соответственно, тогда как для и вероятность есть монотонная функция от счёта. Рассмотрение утверждения о том, что вероятность является монотонной функцией от счёта для любых случаев, когда либо , оставим читателю.
Также, при наблюдается равенство вероятностей для счётов 10-8, 10-9, 9-10, 8-10, и для счётов 3-5, 4-5, 5-4, 5-3. Покажем, что для любого при вероятность счёта равна вероятности счёта .
Вероятность счёта в данном случае есть , а вероятность счёта есть .
Заметим, что .
Получаем, что .
Полученный результат легко объясняется с точки зрения модели: и для счёта и для счёта в серии матчей должен возникнуть счёт после какого-то матча. Из этого счёта может с вероятностью получиться счёт , либо с вероятностью может получиться счёт . Из последнего счёта возможен только счёт или с равными вероятностями.
Так, для формата FT2/BO3 получаем что действительно, если команды равны и исход матча определяется симметричной бернуллиевской монеткой, то вероятности счётов 2-0/0-2 и счётов 2-1/1-2 одинаковы и составляют каждый. Означает ли это, однако, что итоговый счёт для формата FT2/BO3 не позволяет извлечь совершенно никакой информации о силе команд и вероятностях победы?
Заметим, что полученные нами ранее формулы для вероятностей счёта позволяют найти ML-оценки вероятностей победы и . Вероятность счёта пропорциональна произведению . Логарифм правдоподобия, с точностью до постоянного слагаемого, есть . Дифференцируя логарифм правдоподобия по и приравнивая производную к нулю получаем условие экстремума: .
Отсюда следуют оценки на вероятности: , . Доказательство того, что эти оценки максимизируют логарифм правдоподобия, оставим читателю.
Таким образом, хоть формата FT2/BO3 и недостаточно для точной оценки относительной силы команд, однако некоторую информацию ML-подход всё-таки позволяет извлечь. Рассмотрим, как меняется функция правдоподобия для фиксированного счёта:
Вероятности для счётов 2-0 и 0-2 принимают максимум в точках, соответствующих однозначной победе соответствующей команды. Вероятности для счётов 2-1 и 1-2 принимают максимум в точках и соответственно, т.е. счёт с одной победой в серии проигравшей команды является более сильным свидетельством в пользу равенства команд, нежели счёт "в одни ворота". Как от вероятности зависит будет ли счёт "в одни ворота" или нет в формате FT2/BO3 ?
Вероятность счёта "в одни ворота" есть сумма вероятностей для счётов 2-0 и 0-2. Эта вероятность есть:
Вероятность счёта "не в одни ворота" есть сумма вероятностей для счётов 2-1 и 1-2. Эта вероятность есть:
Можно заметить, что счёты 2-1/1-2 могут выпадать при практически любом соотношении сил команд, кроме крайних случаев или . При увеличении равенства сил команд, т.е. при , вероятность счётов 2-1/1-2 увеличивается, но она всегда ниже вероятности счётов 2-0/0-2 и становится равной только в точке своего максимума (и минимума вероятности 2-0/0-2), при . Т.е. проводя между фиксированными командами достаточно большое количество серий матчей в формате FT2/BO3, мы не увидим результатов 2-1/1-2 более чем в 50% серий матчей просто в силу того, что счёт "не в одни ворота" не выпадает чаще 50% независимо от силы команд. А в случае неравенства сил команд частоты счётов 2-1/1-2 будут даже меньше 50%. Факт выпадения счётов 2-1/1-2 свидетельствует в пользу равенства команд, тогда как факт выпадения счётов 2-0/0-2 говорят об обратном.
При проведении турнира у нас нет возможности посчитать частоты различных счётов, так как большинство серий матчей проводятся для каждой пары команд, т.е. для каждых вероятностей и , лишь один раз. Тем не менее, даже единственный сампл счёта позволяет извлечь информацию об относительной силе команд. Несмотря на то, что при равной силе команд счёты 2-0/0-2 выпадают с такой же частотой, что и счёты 2-1/1-2, это не говорит о том, что мы можем просто не учитывать факт выпадения тех или иных счётов. Чем больше счётов 2-1/1-2 мы получаем в турнире — тем больше у нас оснований полагать, что в условиях описанный выше модели силы команд, участвующих в турнире, действительно примерно равны.