Mic (mi_b) wrote,
Mic
mi_b

Что такое "знать"? Что значит "уметь предсказывать"?

Очень интересная штука - "unexpected hanging" (UH) парадокс. Если коротко, то приговоренному к казни сообщают, что его казнят на следуюшей неделе, но день казни будет ему заранее не известен. Приговоренный рассуждает: "Если я доживу до утра воскресенья, то буду знать, что меня казнят ввоскресенье. Значит, казнить меня в воскресенье не могут. Но тогда не могут казнить и в Субботу, потому что утром в Субботу я буду знать, что, раз в воскресенье меня не казнят, меня казнят сейчас. И т.д. Значит, меня не казнят!", а его, бедного, казнят совершенно неожиданно в среду. Связь его с "repeated prisoner's dilemma" (PD), про которую я уже как-то тут писал, вполне очевидна - в обоих случаях используется обратная индукция. PD и ее политические последствия довольно популярная тема; экономисты называют ее обычно "The Tragedy of the Commons" и создали из этого дела целую науку (еще бы, гранты под "трагедии" и "public choice" получать, небось, проще, чем под каких-то зк ;).

Соотвественно, люди "правых" - в смысле "либертарианских" - воззрений не любят всей этой науки и считают, что в PD есть какой-то обман. mises.org несколько туманно, но с надеждой утверждает, что PD страдает той же логической ошибкой, что и UH. Кажется, это не так, и с формальной логикой в PD все в порядке (а в UH, конечно, не в порядке.)

Но обман в PD, действительно, есть. В случае однократной игры "оптимальное" поведение игроков - двойное предательство. "Оптимальное" означает Nash-оптимальное, то есть оптимальное для каждого игрока при любом фиксированном выборе другого игрока. Неоптимальность двойного предательства при бесконечном (или конечном, но неизвестном заранее) числе попыток хорошо известна. Но и при конечном и известном заранее числе попыток, в экспериментах люди обычно получают куда лучшие результаты, чем при Nash-"оптимальных" стратегиях. Кажется, дело в том, что Nash-equilibrum в повторяемых играх требует Марковости решений (то есть независимости решений от предыдуих решений), поэтому все эффекты обучения теряются в Nash-анализе.

Вот очень забавный лог первого эксперимента с комментариями. Там поднимается еще одна интересная проблема - они играют в игру с несимметричной матрицей и один из участников ("богатый", в чью сторону перекошена матрица) пытается "кооперировать" в обычном смысле, а другой пытается "кооперировать" уравнивая при этом выигрыши, то есть иногда "предает". При этом "сытый голодного не разумеет" - оба друг друга не понимают: кооперация с разыми целями выглядит как непостоянная кооперация - поучительное зрелище.

Обсуждение здесь



Subscribe

  • мужской комендантский час

    В Лондоне пропала, а потом была найдена убитой молодая женщина, Сара Эверард. По подозрению в убийстве арестовали действующего лондонского…

  • секс и климат

    Gender and climate are intertwined, but what does it mean for investors? Francis Condon from UBS Asset Management joins the debate with…

  • о криворукости

    История с отравлением Навального с самого начала была совершенно фантасмагорическая: страшное KGB годы моталось по всей стране за Навальным,…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 1 comment