Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam

Пикабу Игры +1000 бесплатных онлайн игр

Начните с маленькой подводной лодки: устанавливайте бомбы, избавляйтесь от врагов и старайтесь не попадаться на глаза своим плавучим врагам. Вас ждет еще несколько игровых вселенных, много уникальных сюжетов и интересных загадок.

Пикабомбер

Аркады, Пиксельная, 2D

Играть
Классический арканоид для любителей ретро-игр. Защитите космический корабль с Печенькой (и не только) на борту, проходя уровни в арканоиде.

Арканоид Пикабу

Арканоид, Аркады, Веселая

Играть
Сыграйте в классический пасьянс и попробуйте разложить по порядку колоду из 52 карт, начиная с короля и заканчивая тузом. Игра имеет четыре варианта: с 1, 2, 3 и 4 мастями. Выиграйте как можно больше в каждом варианте и улучшите свои показатели.

Пасьянс Паук «Классический»

Карточные, Логическая, Мобильная

Играть
Динамичный карточный батлер с PVE и PVP-боями онлайн! Собери коллекцию карточных героев, построй свою боевую колоду и вступай в бой с другими игроками.

Cards out!

Карточные, Ролевые, Стратегии

Играть
Archer Ragdoll Masters — экшн-игра со стрельбой из лука стикменом с физикой тряпичной куклы.

Archer Ragdoll Masters

Аркады, Гиперказуальные, 2D

Играть

Топ прошлой недели

  • Oskanov Oskanov 8 постов
  • AlexKud AlexKud 26 постов
  • StariiZoldatt StariiZoldatt 3 поста
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня

Дилемма заключенного

С этим тегом используют

Теория игр Математика Все
29 постов сначала свежее
5
SlyVolunteer
SlyVolunteer
5 месяцев назад
Серия Происхождение экономических систем

Продолжение поста «Равновесие Нэша и дилемма заключенного: как математика связана с развитием человеческой цивилизации?»⁠⁠3

Равновесие Нэша - это рациональная математическая концепция, которая на первый взгляд кажется универсальным решением для построения гармоничных социальных систем. Однако, как подчеркивают участники дискуссии в комментариях к исходному посту, реальная жизнь вносит свои коррективы. Именно асоциальные элементы и психопатические (предельно эгоистические) стратегии могут нарушать любые попытки стабилизировать общество, если не предусмотрены механизмы их выявления и устранения.

Как пишет @Stellbard, «всегда будут асоциальные личности, которые при любой коммуникации забьют на договоренности» [#comment_334168427]. Это подчеркивает, что даже в кооперативной системе достаточно одного индивидуума, действующего против интересов группы, чтобы создать эффект домино. Именно это и ведет к эскалации насилия, дестабилизации и разрушению доверия внутри системы. Пикабушник @BozZiLLA добавляет: «Капитализмом движет не инновации и благополучие человечества, а страх потерять имущество и жажда прибыли» [#comment_334109297]. Это усиливает понимание необходимости контроля и регулирования эгоистичных стратегий.

Для решения этой проблемы на ум приходят два подхода:

1) идентификация и исправление/изоляция деструктивных элементов. Современные технологии (искусственный интеллект и нейросети) могут помочь выявлять манипуляторов и лиц с психопатическими наклонностями на ранних этапах.

2) образование и воспитание. Увеличение уровня знаний о теории игр, истории, политэкономии и кибернетике может уменьшить вероятность появления деструктивных стратегий. Однако, как отмечает @Pauluzzz, не все люди от природы склонны к обучению и пониманию сложных систем [#comment_334299419]. Я в комментариях предложил рассматривать социальный рейтинг как элемент воспитания, где корреляция денег и общественной пользы могла бы мотивировать людей действовать во благо общества [#comment_334111446].

Психопатические стратегии не раз проявляли себя в истории. Вот некоторые примеры, предложенные участниками обсуждения:

1) Колонизация Америки - конкистадоры использовали доверие коренных народов, чтобы затем манипулировать ими и эксплуатировать их ресурсы [#comment_334196637].

2) Манипуляции финансовых рынков в начале XX века, закончившиеся кризисом 1929 года - крупные игроки манипулировали доверием инвесторов, накачивая активы фиктивной стоимостью, чтобы потом обогатиться, обрушив рынок [#comment_334228121].

3) Вторая мировая война - нацисты под угрозой глобальной войны в начале довольно долго решали свои задачи, постепенно получая все больше ресурсов и влияния до начала столкновения [#comment_334218061].

4) Развал СССР - лидеры республик и партийные функционеры, декларируя приверженность общим целям, действовали в своих интересах, манипулируя массовым сознанием [#comment_334196637].

5) Кризис доткомов - создание фиктивной стоимости активов и манипуляции доверием инвесторов для извлечения максимальной выгоды [#comment_334218061].

Эти примеры показывают, что кооперативные системы, стремящиеся к равновесию Нэша, с высокой степенью доверия могут стать уязвимыми к действиям «психопатических игроков».

Возможно использовать возможности нейросетей и цифровизации для раннего выявления манипуляций и подрыва общественной ценности. Искусственный интеллект способен анализировать сложные паттерны поведения и сигнализировать о рисках. Например, нейросети могут быть полезны для диагностики психопатии и предотвращения деструктивных стратегий, основанных на манипуляции доверием.

Однако возникают вопросы:

1) Как гарантировать, что эти технологии не будут использоваться самими психопатами?

2) Как сбалансировать права личности и безопасность общества?

Многие участники дискуссии считают, что ключевую роль в построении устойчивой системы играет образование. Но, как замечает @Pauluzzz, невозможно добиться одинаково высокого уровня интеллекта у всех людей [#comment_334312109]. Тем не менее, я утверждаю, что интеллект можно развивать, приводя примеры обучения подопытных животных и собственного опыта, где мотивация и доступное объяснение помогли преодолеть трудности в обучении [#comment_334305180]. @BozZiLLA указывает, что в условиях коммунистической идеологии, несмотря на её антирелигиозный настрой, воспитывалась духовность, тогда как либеральная идеология капитализма часто фокусируется на материальных ценностях [#comment_334109297].

Еще один важный аспект - незамкнутость государств. В глобальном мире интересы отдельных групп могут идти вразрез с интересами государства. Например, перенос производств в страны с более низкими издержками труда подрывает экономику родной страны [#comment_334288664]. Решением здесь может стать кооперация на глобальном уровне (многополярный мир) и создание равновесия Нэша между государствами [#comment_334297651].

Наконец, обсуждение затронуло вопрос смысла существования человечества. @Pauluzzz скептически относится к идее космической экспансии и считает, что научное познание вряд ли станет универсальным смыслом для большинства людей [#comment_334299419]. Я обратил внимание на те же нейросети как на инструмент, способный компенсировать ограниченность человеческой жизни и способствовать достижению глобальных целей [#comment_334305180].

Вывод

Для достижения устойчивости в равновесном по Нэшу (многополярном) обществе необходимо учитывать:

1) Использование технологий для мониторинга и предотвращения манипуляций.

2) Раннее выявление и исправление/изоляцию деструктивных элементов.

3) Повышение уровня образованности и научности.

4) Кооперацию на глобальном уровне (многополярный мир) для создания равновесия интересов.

Какие еще подходы вы можете предложить, чтобы человечество смогло минимизировать влияние психопатических/эгоистических стратегий и направить развитие цивилизации в русло прогресса и гармонии?

P.S. В дебатах «Кооперативный капитализм vs Технологический коммунизм» проголосовало 76 человек, из них кооперативный капитализм выбрало 25%, за технологический коммунизм проголосовало 75%.

Показать полностью
[моё] Развитие Будущее Теория игр Равновесие Джон Нэш Дилемма заключенного Капитализм Коммунизм Социализм Цивилизация Критическое мышление Научпоп Ответ на пост Текст Длиннопост
16
SlyVolunteer
SlyVolunteer
5 месяцев назад
Серия Происхождение экономических систем

Продолжение поста «Равновесие Нэша и дилемма заключенного: как математика связана с развитием человеческой цивилизации?»⁠⁠3

Дебаты Развитие Будущее Теория игр Равновесие Джон Нэш Дилемма заключенного Капитализм Коммунизм Социализм Цивилизация Критическое мышление Ответ на пост
4
78
SlyVolunteer
SlyVolunteer
5 месяцев назад
Наука | Научпоп
Серия Происхождение экономических систем

Равновесие Нэша и дилемма заключенного: как математика связана с развитием человеческой цивилизации?⁠⁠3

Равновесие Нэша [1] - это концепция из теории игр, которая объясняет, как в ситуациях с несколькими участниками каждый игрок может принимать решения, не желая менять свою стратегию, если остальные тоже остаются при своих. В равновесии Нэша все участники действуют оптимально относительно друг друга, даже если их действия не приводят к наилучшему личному результату [2].

Пример из фильма «Игры разума» помогает визуализировать эту идею. В одной из сцен Джон Нэш с друзьями сидит в баре, когда в помещение заходят несколько девушек, включая одну очень привлекательную блондинку. Друзья решают, что все должны попробовать привлечь внимание блондинки, ведь она самая красивая. Однако Нэш замечает, что если каждый будет пытаться ухаживать за блондинкой, они будут мешать друг другу, и в итоге никто не добьётся успеха — блондинка отвергнет всех, а остальные девушки почувствуют себя второстепенными и тоже откажут.

Тогда Нэш предлагает иную стратегию: никто из них не обращается к блондинке. Вместо этого каждый выбирает одну из её подруг. Это минимизирует конкуренцию и увеличивает шансы на успех, так как остальные девушки почувствуют себя ценными.

Вот этот отрывок из фильма, смотрите с 14 секунды, чтобы пропустить заставку канала:

Реальная математика за этой концепцией сложнее, но её можно представить как «баланс интересов», где каждый действует, учитывая действия других, и никому невыгодно действовать иначе. Хотя на самом деле принцип равновесия Нэша был известен человечеству уже более 19 столетий.

Равновесие Нэша и библейский принцип «возлюби ближнего своего, как самого себя» могут быть неожиданно связаны через идею гармоничного взаимодействия людей в обществе, где индивидуальные и коллективные интересы сбалансированы.

В равновесии Нэша каждый участник выбирает стратегию, которая оптимальна для него, учитывая действия других. Это не означает альтруизм, но предполагает, что участник осознаёт влияние своих действий на других. Если никто не может улучшить своё положение, не ухудшив положение остальных, достигается баланс. Принцип «возлюби ближнего своего, как самого себя» также олицетворяет баланс. Он призывает относиться к другим с такой же заботой, как к самому себе, не ставя свои интересы выше, но и не игнорируя их. Это создаёт основу для гармоничного сосуществования, где личные и общие блага взаимосвязаны.

В обоих случаях ключевой идеей является необходимость учитывать не только свои интересы, но и интересы окружающих. В равновесии Нэша это делается рационально, чтобы достичь устойчивого результата, а в библейском принципе - морально, чтобы построить справедливое общество. Если каждый будет действовать, думая и о себе, и о других (равновесие Нэша), либо любить ближнего, как себя (библейский принцип), то создаётся система, где меньше конфликтов и больше взаимной выгоды.

Представьте ситуацию, где несколько человек делят ограниченный ресурс, например, воду или еду. Принцип Нэша подскажет им найти баланс: никто не возьмёт больше, чем ему нужно, чтобы остальные не начали нарушать договорённости. Принцип любви к ближнему добавляет моральное измерение: люди добровольно ограничивают себя из заботы о других, возможно, даже жертвуя чем-то ради общего блага.

Фильм «Платформа» (2019) — это мощная метафора социального неравенства, идеально иллюстрирующая ситуации, где равновесие Нэша нарушается, а библейский принцип «возлюби ближнего своего, как самого себя» игнорируется. Башня представляет собой вертикальную тюрьму с множеством этажей. Ежедневно через башню движется платформа с едой, начиная с верхних этажей. Количество еды достаточно для всех, если бы её делили равномерно. Но на практике верхние уровни берут больше, чем им нужно, не оставляя ничего для нижних. Те, кто живут ниже, страдают от голода, злости и отчаяния.

Равновесие Нэша и дилемма заключенного: как математика связана с развитием человеческой цивилизации? Развитие, Будущее, Теория игр, Равновесие, Джон Нэш, Дилемма заключенного, Капитализм, Коммунизм, Социализм, Цивилизация, Критическое мышление, Видео, Длиннопост, RUTUBE

Нижние этажи страдают от голода, злости и отчаяния

В таком обществе каждый действует исходя из своих интересов, игнорируя последствия для других. На верхних этажах рационально предположить, что если ты не возьмёшь еду сейчас, то, оказавшись на нижних уровнях, можешь остаться без неё. Это приводит к тому, что каждый игрок берёт как можно больше еды, не думая о тех, кто ниже. Это стратегия индивидуального выживания, но она разрушает возможность устойчивого равновесия.

В результате система становится нестабильной: нижние этажи страдают, а высшие боятся, что в любой момент могут оказаться среди обделённых. Если бы узники следовали принципу «возлюби ближнего своего, как самого себя», они могли бы организовать равномерное распределение еды. Например, каждый мог бы взять ровно столько, сколько ему нужно. Это обеспечило бы выживание всех обитателей башни, стабилизировало систему и уменьшило бы насилие.

Почему система не достигает равновесия Нэша?

1) Недостаток доверия

Люди не верят, что другие придерживаются договорённостей, и предпочитают действовать эгоистично.

2) Отсутствие коммуникации

Узники изолированы и не могут договориться, что увеличивает хаос.

3) Принудительная система

Башня сама по себе стимулирует конкуренцию, а не сотрудничество.

«Платформа» показывает, как эгоистичное поведение разрушает общее благо. Чтобы выйти из замкнутого круга неравенства, необходимо больше, чем просто рациональный расчёт — нужна эмпатия, доверие и готовность делиться ресурсами. Это напоминает, что для устойчивости общества важно сочетать рациональность (равновесие Нэша) и моральные принципы.

Дилемма заключенного

Дилемма заключённого [3] - это классический пример из теории игр, который прекрасно иллюстрирует проблему недостатка доверия и его влияние на принятие решений. Она показывает, как рациональное поведение в условиях недоверия может привести к худшему исходу для всех участников.

Два подозреваемых арестованы и изолированы друг от друга. Им предложены варианты:

1) Если один сдаёт другого (предательство), а второй молчит, предатель освобождается, а молчащий получает максимальный срок (например, пожизненное заключение).

2) Если оба молчат, они получают минимальный срок (например, 1 год).

3) Если оба предают, они оба получают средний срок (например, 5 лет).

Поскольку игроки не могут доверять друг другу, логично предположить, что другой выберет предательство, чтобы минимизировать свой срок. Поэтому оба обычно выбирают предательство, что приводит к среднему сроку для каждого, хотя если бы они доверяли друг другу и молчали, их срок был бы минимальным.

В дилемме заключенного участники не могут договориться или гарантировать выполнение соглашения, поэтому действуют из страха быть обманутыми. Каждый участник пытается защитить себя от максимального наказания, что приводит к взаимному предательству. В условиях недоверия участники ориентируются только на свои интересы, не принимая во внимание возможные преимущества совместных действий.

Пример фильма «Платформа» показывает, что еда распределяется аналогично дилемме заключённого:

1) Если верхние этажи «молчат» (берут только свою долю), еды хватит всем.

2) Если они «предают» (берут больше, чем нужно), нижние этажи страдают.

Из-за недостатка доверия (верхние этажи предполагают, что если они не возьмут больше, кто-то другой с их этажа это сделает) система разваливается. Взаимное недоверие ведёт к хаосу, где каждый действует эгоистично.

Как преодолеть недостаток доверия?

1) Коммуникация

Если участники смогут договориться, шансы на кооперацию возрастут.

2) Внешние правила

Вмешательство третьей стороны (например, строгие законы или контроль) может стабилизировать систему.

3) Долгосрочные отношения

В повторяющихся играх участники склонны сотрудничать, так как понимают, что их действия влияют на будущее взаимодействие.

Дилемма заключённого и её связь с недоверием - это универсальная модель, применимая в реальной жизни: от социальных конфликтов до экономических систем. Она учит, что для достижения наилучшего коллективного результата необходимы не только рациональность, но и готовность к доверию и сотрудничеству.

Общественный строй и математика

Сравнение капитализма и коммунизма через призму равновесия Нэша и дилеммы заключённого позволяет выявить их сильные и слабые стороны в контексте кооперации, доверия и эффективности решения социальных проблем.

Капитализм поощряет каждого участника системы (предприятия, работников, потребителей) действовать в своих собственных интересах. Это часто приводит к ситуации, где каждый принимает оптимальное решение для себя, но не всегда для общества. Конкуренция стимулирует инновации и развитие, но приводит к неравномерному распределению ресурсов (например, богатство концентрируется у элит).

Капитализм создаёт множество ситуаций, где компании или люди принимают решения, основанные на недоверии. Например, загрязнение окружающей среды выгодно для отдельных корпораций, даже если оно наносит ущерб обществу. Недостаток кооперации и ориентация на краткосрочную выгоду затрудняют решение глобальных проблем, таких как изменение климата или социальное неравенство.

Коммунизм стремится к тому, чтобы участники действовали в интересах всего общества. В идеальной коммунистической системе люди выбирают стратегии, которые максимизируют общественное благо. Таким образом, коммунизм приводит к равновесию, где ресурсы распределяются справедливо, что снижает социальное напряжение.

Коммунизм предполагает высокую степень доверия между участниками системы. Если кто-то начинает действовать эгоистично (например, злоупотреблять ресурсами), система становится нестабильной. Исторически попытки реализации коммунизма сталкивались с проблемой морального риска: когда люди считают, что могут получать выгоды, не внося вклад, доверие разрушается.

Какой строй более выгоден для цивилизации?

Идеальный ответ может лежать в синтезе лучших черт обеих систем:

1) Кооперативный капитализм - модель, в которой рыночная конкуренция сочетается с сильными социальными гарантиями и глобальным сотрудничеством для решения общих проблем.

2) Технологический коммунизм - система, где технологии (например, искусственный интеллект и автоматизация) устраняют необходимость жёсткой иерархии, позволяя справедливо распределять ресурсы.

Капитализм быстрее продвигает технологии из-за конкуренции. Коммунизм эффективнее в устранении социальных неравенств, что ускоряет развитие человеческого потенциала в долгосрочной перспективе. Капитализм решает проблемы выборочно, ориентируясь на прибыль. Коммунизм направлен на системное решение проблем, но часто сталкивается с трудностями в реализации. Для устойчивого развития цивилизации в долгосрочной перспективе потребуется гибридная модель, объединяющая технологический прогресс капитализма с кооперативными и справедливыми принципами коммунизма. Это позволит эффективно решать социальные проблемы и одновременно сохранять высокий темп инноваций.

Литература

[1] Nash, John F. (1950) Equilibrium points in n-person games // PNAS. 36 (1): 48–49. doi:10.1073/pnas.36.1.48

[2] Мазалов В. В. Математическая теория игр и приложения. — Изд-во Лань, 2010, 446 с.

[3] Poundstone, William (1992) Prisoner’s Dilemma: John von Neumann, Game Theory, and the Puzzle of the Bomb. — Doubleday. ISBN 0-385-41567-2.

Показать полностью 1
[моё] Развитие Будущее Теория игр Равновесие Джон Нэш Дилемма заключенного Капитализм Коммунизм Социализм Цивилизация Критическое мышление Видео Длиннопост RUTUBE
132
125
Emelyanov
Emelyanov
1 год назад

Антипрививочники поступают рационально⁠⁠

Спокойно! Я всё могу объяснить, отложите вилы и факелы.

Антипрививочники поступают рационально Вакцинация, Антипрививочники, Математика, Дилемма заключенного, Мракобесие, Длиннопост

Тут вот какая штука: прививки реально могут вызвать побочные реакции, этот факт, я думаю, никто отрицать не будет. Побочные реакции проявляются далеко не у всех и зачастую носят вполне терпимый характер, но тем не менее они бывают. Сам я недавно вот поставил первую прививку от ковида и потом сутки лежал с температурой.

Никто также, я думаю, не будет спорить с тем, что если прививку не ставить, то и никаких побочных эффектов от неё ты не получишь, по очевидным причинам. А вот эффект от вакцинации при этом получить можно, благодаря коллективному иммунитету. Проще говоря, если все вокруг привились, а ты один нет, то ты можешь в принципе и не заморачиваться тогда, будет хорошо и так.

Нельзя не отметить рациональность такого подхода. Хитрый антипрививочник получает все ништяки, не ставя под удар собственное здоровье и не скидываясь в общаг коллективного иммунитета. Умные люди называют это «дилеммой заключённого» и признают, что предательство других является самым рациональным действием.

Антипрививочники поступают рационально Вакцинация, Антипрививочники, Математика, Дилемма заключенного, Мракобесие, Длиннопост

Умные люди, не я, не казните посланника.

Да, они сильно преувеличивают возможный урон от побочных эффектов, как и вероятность эти побочные эффекты вообще заметить, но тем не менее. Но они, получается, вовсе не мракобесы.

Однако, убеждать антипрививочников сделать укольчик всё-таки как-то надо, потому как иначе усилия остальных будут напрасными. К счастью, в математике уже всё давно посчитано до нас, нам остаётся лишь использовать её на благо всего человечества.

Коса антипрививочного рационализма находит на камень, когда путь предательства в дилемме заключенного выбирает слишком большое количество людей. Внезапно рациональная до этого позиция становится откровенно мудацкой.

Антипрививочники поступают рационально Вакцинация, Антипрививочники, Математика, Дилемма заключенного, Мракобесие, Длиннопост

Метафорически это можно представить так: группа друзей собралась в ресторане, планируя в конце вечера разделить счёт, а один из них, самый хитрый, задумал в ответственный момент сказать, что забыл кошелёк дома. Однако, когда принесли счёт, то вдруг выяснилось, что таких хитрых за столом оказалось несколько, и у остальных банально не хватило заплатить денег за всех. Это уже называется «равновесием Нэша».

Точно такая же ситуация возникает и с прививками, когда не привит хотя бы каждый пятый. И ровно так же страдают от этого все, даже те, кто честно привился, рискнув и возможно получив какие-либо побочные эффекты, в том числе и довольно серьёзные. Вот это должно быть реально обидно.

В итоге лично я советую убеждать противников вакцинации не с позиции «вот вы мракобесы», а зайти вместо этого с неожиданной стороны и донести до оппонента мысль, что он халявщик. Таких в нашей стране не любят куда больше, чем мракобесов, халявщиком быть реально стыдно.

Плюс - это спасибо за авторский пост.

Подпишись, если понравилось, постов у меня еще много.

Антипрививочники поступают рационально Вакцинация, Антипрививочники, Математика, Дилемма заключенного, Мракобесие, Длиннопост
Показать полностью 3
[моё] Вакцинация Антипрививочники Математика Дилемма заключенного Мракобесие Длиннопост
92
28
Emelyanov
Emelyanov
1 год назад
Офисные будни

Идеальная стратегия для взаимодействия с людьми⁠⁠

Наткнулся тут на пост о том, как с людьми в жизнь играть, мол сама оптимальная стратегия. В принципе, ничего нового не узнал практически, так как про эту стратегию уже знал, и даже как-то раз применил на практике. Забавная вышла история, сейчас расскажу.

Идеальная стратегия для взаимодействия с людьми Работа, Эффективный менеджер, Начальство, Совет, Офис, Дилемма заключенного, Тимбилдинг, Мат


Я на тот момент ещё в офисе работал, большом и солидном, и решили там однажды провести тимбилдинг или что-то в этом роде. Нас поделили на четыре команды, развели по разным комнатам, и объяснили правила, стандартные для игры с дилеммой заключённого. То есть каждый раунд мы можем или доверится остальным трём командам, или предать их. Те, кто доверился и был преданным, вообще ничего не получают, а вот предатели получают много, с тем нюансом, что когда предателей слишком много, они получают чуть больше, чем ничего. Оптимально было бы вообще никому и никого не предавать, за это очков больше всего, но так как поговорить с другими командами возможности не было, то получилось как получилось.

А получилось оно ожидаемо. Одна команда выбрала стратегию максимальной порядочности, и об них всю игру вытирали ноги, очков они набрали меньше всех. Вторая команда делала вообще чет хаотическое, не было там явно лидера никакого, и стратегия их менялась чаще, чем носки в жаркий день. Третья команда были мразотами, предавали всех только в путь, заняли в итоге второе место, ну а победителями, понятное дело, стала моя команда, что следовала той самой стратегии, которая в посте по ссылке описана. Это был мой триумф и как человека, и как лидера.

Вот только награды дали не нам, а проигравшим позорникам на четвёртом месте.

Как оказалось, наши команды символизировали разные отделы нашей большой компании (о чем нам забыли сообщить) и таким образом руководство хотело поощрить этих няшных зайчиков, которые жертвовали собой несмотря ни на что. А призы там были как дурацкие, типа кофе от технического директора, так и вполне весомые, как например оплачиваемый выходной. Было обидно.

Мораль сей басни такова, что победа это не всегда победа, это кого надо победа, как человек над всеми порешает.

Хотя я в целом был рад, что оказался прав, и стратегия реально оказалась рабочая. И тут, кстати, уже не важно, с другими людьми ты «играешь», с дружественными отделами в одной фирме, с другими компаниями или другими странами – масштабируется идеально. Кабы не произвол свыше от директора филиала, наш "отдел" собрал бы все награды, а ребята с кредо "пожалуйста не бейте, лучше обоссыте" обсыхали бы на четвертом месте из четырех. Всё как в жизни.

Ну и я отдельно порадовался в тот день, что начальник службы логистики, который всегда был такой добрый и отзывчивый, но вечно каждым вторым подрядчиком кинутый, был в моей команде. И после игры он уходил прям очень и очень задумчивый, а потом и проблем с подрядчиками у него стало меньше.

Показать полностью 1
[моё] Работа Эффективный менеджер Начальство Совет Офис Дилемма заключенного Тимбилдинг Мат
5
11
Eriright
Eriright
2 года назад
Серия Теория игр для начинающих

Повторяющаяся дилемма заключённого⁠⁠

В книге «Эволюция кооперации» (1984) Роберт Аксельрод исследовал поведение игроков в повторяющейся дилемме заключенного. Он предложил своим коллегам реализовать алгоритмы, реализующие данную игру и провёл турнир среди данных алгоритмов. В турнире приняло участие много программ, реализующих алгоритмы. Интересно, что по поведению программ можно было наделять их человеческими качествами. Например, оказалось, что «жадные» программы начинали терпеть поражение после нескольких игр, то есть, в долгосрочной перспективе они оказывались несостоятельными. «Альтруистические» программы, стремящиеся к кооперации приводили, опять таки, в долгосрочной перспективе, к положительным результатам в плане выигрыша. Аксельрод показал, что возможен естественный отбор, приводящий к альтруистическому поведению при начальном эгоистичном поведении.

Среди представленных программ были как очень сложные, так и очень простые, как детерминистические (не зависящие от случайных чисел), так и не детерминистические (смешанные). Интересно, что наилучшей из детерминистических стратегий оказалась стратегия «око за око», которая состояла всего из четырёх строк на бейсике. Она всегда сотрудничала на первом шаге, а на следующих шагах она повторяла поведение соперника, то есть, «предавала», если предавал соперник, и «сотрудничала», если сотрудничал соперник. Если добавить к этой стратегии элемент случайности, например, чтобы в случае предательства программа иногда, с вероятностью 1-5%, прощала, то результат мог бы оказаться ещё лучше. Это помогало разрушить цикл взаимного предательства (интересно звучит).

Анализируя результаты турнира, Аксельрод выделил несколько условий, способствующих высоким результатам в игре.

  1. Стратегия не должна предавать до тех пор, пока ее не предаст противник. Почти каждая стратегия в верхней части турнирной таблицы обладала данным свойством, назовем его добротой. Интересно, что для получения наибольшей выгоды для себя, то есть из чисто корыстных побуждений, стратегия не должна предавать противника первой.

  2. Стратегия должна реагировать на попытку противника предать ее. Стратегия всепрощения обречена на провал, потому что всегда найдется «подлая» стратегия, которая непременно воспользуется такой наивностью. Другими словами, успешная стратегия должна быть мстительной.

  3. Если противник перестанет предавать, хорошей стратегией будет возобновление сотрудничества. Стратегия должна быть мягкой. Стратегия должна уметь прощать.

  4. Зависть – желание набрать очков больше, чем соперник. Это – плохое свойство, хорошие стратегии независтливы.

Вывод из этого эксперимента звучит странно: для того, чтобы стратегии-эгоисты получали как можно больше выгоды для себя, они должны быть добрыми, независтливыми и прощающими. Неожиданно, не так ли?


Игра в монетки

Давайте проанализируем следующую игру.

Имеется два игрока. Один из них прячет монету в руке. Другой пытается угадать, где монета. Игрок, угадавший, в какой руке монета у партнёра, забирает её. Если угадать не получилось, мы отдаём партнёру по игре свою монетку.

Построим матрицу платежей для данной игры.

Повторяющаяся дилемма заключённого Математика, Книги, Задача, Логика, Популяризация, Теория игр, Научпоп, Дилемма заключенного
Повторяющаяся дилемма заключённого Математика, Книги, Задача, Логика, Популяризация, Теория игр, Научпоп, Дилемма заключенного


Как мы видим, в данной игре ВООБЩЕ нет никаких равновесий – ни по Нэшу, ни Парето-оптимальных.

Как вы думаете, какое будет равновесие в смешанных стратегиях в данной игре?

Вы можете попробовать поиграть в данную игру со своими друзьями, чтобы попробовать найти вашу лучшую стратегию.

Показать полностью 2
[моё] Математика Книги Задача Логика Популяризация Теория игр Научпоп Дилемма заключенного
8
11
Eriright
Eriright
2 года назад
Серия Теория игр для начинающих

Парадокс Сена⁠⁠

Всем привет! Я продолжаю свою серию постов по популяризации науки :) Пока я выкладываю материалы по теории игр.



Штрафы за отклонение от стратегий

Парадокс Сена Математика, Книги, Теория игр, Дилемма заключенного, Популяризация, Парадокс, Длиннопост

Введя штрафы за какие-то поступки, можно достаточно сильно поменять матрицу платежей.

Пусть Франкенштейн и Дракула заключили предварительно такой договор: в случае, если кто-то один из них попытается заложить другого, друзья того, кого он заложил, поймают и посадят его в подвал на 3 года. Посмотрим, как изменится матрица платежей в данном случае.

Парадокс Сена Математика, Книги, Теория игр, Дилемма заключенного, Популяризация, Парадокс, Длиннопост

Ну что же, очевидно, что теперь уже взаимное молчание является равновесием. Так что да, такой механизм вполне работает.


Парадокс Сена


Я закончу первоначальное знакомство с теорией игр и концепцией равновесий по Нэшу и Парето-оптимальности еще одним парадоксом, связанным с концепцией оптимума в смысле Парето.


Либеральный парадокс, также называемый парадоксом Сена, представляет собой логический парадокс, предложенный Амартия Сеном в статье 1970 года. Он показывает, что ни одна социальная система не может одновременно быть привязанной к минимуму свободы, и приводить к эффективности по Парето.


Этот парадокс спорен, потому что он, кажется противоречащим классическому либеральному утверждению, что рынки одновременно эффективны и уважают личные свободы.


В исходном примере Сена использовалось простое общество, в котором было всего два человека и одна социальная проблема для рассмотрения. Назовем этих двух членов общества «Гарри Гудини» и «Дэвид Копперфильд». В этом обществе существует только одна копия «Теории игр». Эту книгу можно дать прочитать либо Дэвиду Копперфильду (решение А), либо Гарри Гудини (В), либо никому (С).


Предположим, что Гарри Гудини нравится такое чтение, и он предпочитает читать само произведение, а не избавляться от него (B>C). Однако еще большее удовольствие он получил бы от того, что Дэвид Копперфильд должен был прочитать эту книгу и немного поумнел (A>B>C).

Парадокс Сена Математика, Книги, Теория игр, Дилемма заключенного, Популяризация, Парадокс, Длиннопост

Дэвид Копперфильд считает, что книга неприлична и ее вообще не следовало издавать, т.е. её вообще не стоит читать (он предпочитает, прежде всего, решение C). Однако, если кто-то должен это прочитать, Дэвид Копперфильд предпочел бы, чтобы это всё-таки сделал он, а не Гарри Гудини (A>B). Итак, для Дэвида Копперфилда C>A>B.


Учитывая предпочтения двух индивидуумов в обществе, специалист по социальному планированию должен решить, что делать. Должен ли планировщик заставлять Гарри Гудини читать книгу (A), заставлять Дэвида Копперфилда (B) читать её или оставить её непрочитанной (C)? Точнее, должен ли он ранжировать три возможных исхода в соответствии с их социальной желательностью?

Парадокс Сена Математика, Книги, Теория игр, Дилемма заключенного, Популяризация, Парадокс, Длиннопост

Либеральный социальный планировщик решает, что он должен отстаивать права личности, каждый человек должен иметь возможность самостоятельно прочитать книгу.


Гарри Гудини должен иметь возможность решить, будет ли результат «Гарри Гудини читает» (B) иметь более высокий рейтинг, чем «Никто не читает» (C). Точно так же Дэвид Копперфильд также должен иметь возможность решить, будет ли результат «Дэвид Копперфильд читает» (A) выше, чем «Никто не читает» (C).


Следуя этой стратегии, социальный планировщик объявляет, что результат «Гарри Гудини читает» будет иметь более высокий рейтинг, чем «Никто не читает» (из-за предпочтений Гарри Гудини: B>C), и что «Никто не читает» будет иметь более высокий рейтинг, чем «Дэвид Копперфилд читает» (из-за предпочтений Дэвида Копперфилда в C>A). Затем согласованность требует, чтобы «Гарри Гудини читает» был выше, чем «Дэвид Копперфильд читает», и поэтому социальный планировщик дает Гарри Гудини книгу для чтения по принципу транзитивности B>C>A.


Но этот результат либерального планировщика, отдающего предпочтение индивидуальному выбору, и Дэвид Копперфильд, и Гарри Гудини считают хуже, чем «Дэвид Копперфильд читает» (А).


Действительно, Дэвид Копперфильд предпочитает читать плохую книгу вместо Гарри Гудини (A>B для Дэвида Копперфильда), а Гарри Гудини считает, что книга настолько хороша, что Дэвид Копперфильд обязательно должен ее прочитать (A>B также для Гарри Гудини).


Таким образом, результат, выбранный либеральным планировщиком, хуже по Парето. Есть еще один результат, который выше по Парето: тот, где Дэвид Копперфильд вынужден читать книгу.

Показать полностью 4
[моё] Математика Книги Теория игр Дилемма заключенного Популяризация Парадокс Длиннопост
5
10
Eriright
Eriright
2 года назад
Серия Теория игр для начинающих

Парето-оптимальность⁠⁠

Всем привет! Я продолжаю свою серию постов по популяризации науки :) Пока я выкладываю материалы по теории игр.


Парето-оптимальность


Из двух возможных видов игр мы до сих пор рассматривали только некооперативные, то есть те, в которых каждый игрок является эгоистом и желает максимизировать только свой собственный выигрыш или минимизировать свой проигрыш. Возникает вопрос: почему, например, в дилемме заключённого игроки не могут договориться между собой о том, какие стратегии применять?


Критики игрового анализа дилеммы заключённого считают, что рациональное поведение, приводящее к более выгодным для всех ситуациям, возникает не для отдельных лиц, а для групп. Поэтому они считают, что для отдельно взятого игрока его оптимальная стратегия будет заключаться в достижении оптимальной цели для всей группы в целом. Теория рабочего класса Карла Маркса является проявлением такого мышления.


Вильфредо Парето (1848–1923), итальянский социолог и экономист, внес свой вклад в изучение распределения доходов и анализ индивидуального выбора. Он вводит понятие эффективности и помогает развивать область микроэкономики с помощью таких идей, как кривая безразличия. Возможно, вы уже слышали о «принципе Парето». Также называемый законом Парето, принципом 80-20 или даже законом 80-20, это эмпирическое явление, наблюдаемое в определенных областях: примерно 80% следствий являются продуктом 20% причин. Хотя работы Парето не обязательно подразумевает распределение 80-20, Джозеф Джуран в 1954 году использовал выражение «принцип Парето» для его обозначения.


Другой термин, носящий его имя, связан с теорией игр. Пусть имеется система с несколькими частными показателями. Тогда система достигла оптимальности по Парето (стала эффективной по Парето), если при улучшении любого из показателей достигается ухудшение других.


Сам Парето высказывался так:


«Всякое изменение, которое никому не приносит убытков, а некоторым людям приносит пользу (по их собственной оценке), является улучшением»


Относительно исходной ситуации, улучшение по Парето — это новая ситуация, в которой некоторые агенты выиграют, а ни один агент не проиграет.


Ситуация называется доминируемой по Парето, если возможно улучшение по Парето.

Таким образом, система допускает локальные улучшения до тех пор, пока они не приносят никому вреда.


В своем «Руководстве по политической экономии»  Парето рассматривает максимальную полезность для общества как свойство общего экономического равновесия и определяет ее как положение, при котором всякая малая вариация увеличивает полезность одних и уменьшает полезность других.


Полезность относится к полезности товара или услуги, ощущаемой данным экономическим агентом в данное время, в отличие от объективной полезности того же товара или услуги. Например, для путешественника в пустыне стакан воды субъективно будет стоить намного дороже, чем для человека в бассейне.


Таким образом, система допускает локальные улучшения, если они никому не вредят. Общее благо общества по Парето максимально в том состоянии, когда никакое изменение полученного оптимального распределения не наносит вреда благосостоянию хотя бы одного объекта системы. Например, в дилемме заключённых состояние «оба молчат» является Парето-оптимальным.


Но опять же возникает проблема. Философы, которые считают, что этот факт показывает противоречие между некооперативной и кооперативной теорией игр упускают из виду важность предположения в кооперативной теории игр о том, что могут быть сделаны жесткие договоренности. Не имеет значения, что Франкенштейн и Дракула обещали соблюдать соглашение. Они, например, могут договориться, но не сдержать обещания. Или же они могут затратить ресурсы на обеспечение нерушимости договора.


Фонтан с водой и оптимум Парето


Мы обсудим здесь ситуацию, описанную в статье одного французского исследователя.

В административном ресторане есть довольно классический для франции питьевой фонтан, оборудованный двумя кранами, с одной особенностью, которая кажется весьма распространенной: общий поток воды одинаков при работе одного или обоих кранов. Когда два человека приходят наполнить свои графины, они обычно делают это одновременно, используя оба крана. Это действительно хорошая идея?

Парето-оптимальность Математика, Теория игр, Джон Нэш, Парето, Популяризация, Дилемма заключенного, Длиннопост

Представьте себе, что первый человек, Гензель, подходит к фонтану, чтобы наполнить свой графин. Как раз в тот момент, когда он собирается начать налить себе водички, в свою очередь появляется второй человек, Гретель. У последней есть выбор между двумя стратегиями: активировать второй кран, чтобы наполнить ее графин одновременно с Гензелем, или подождать, пока тот не закончит, прежде чем начать делать это.


Когда работает только один из кранов, он наполняет графин примерно за 20 секунд. Когда оба крана открыты, каждый из них наполняет графин за 40 секунд. Если Гретель решит использовать второй кран, она и Гензель проведут у фонтана 40 секунд. Если же она решит подождать, Гензель проведет там только 20 секунд, а она 40 (20, чтобы подождать и 20, чтобы наполнить свой графин).


Таким образом, Гретель абсолютно ничего не выигрывает, если откроет второй кран, а Гензель в таком случае потеряет 20 секунд. Поэтому лучшим общим решением будет подождать и никогда не использовать оба крана одновременно.


В случае, который нас здесь интересует, есть две ситуации: одна, когда Гретель использует второй кран, и другая, когда она ждет, прежде чем наполнить свой графин. Вторая ситуация – оптимум Парето, но не первая, поскольку можно улучшить результат Гензеля (сократить его время у фонтана с 40 до 20 секунд), не ухудшив результат Гретель (у которой и так и так будет 40 секунд ожидания).


На самом деле, единственный плюс двух краников у таких фонтанов – это возможность поболтать с коллегой, пока наполняются графины, поэтому, несмотря на всю их нелогичность, во Франции они всюду =)


Попробуйте вспомнить, с какими примерами подобных ситуаций вы уже сталкивались в своей жизни?

Показать полностью 1
[моё] Математика Теория игр Джон Нэш Парето Популяризация Дилемма заключенного Длиннопост
0
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии