مثير للإعجاب

معضلة الأسرى

معضلة الأسرى

01 من 04

معضلة الأسرى

معضلة الأسرى هي مثال شائع على لعبة تفاعل إستراتيجي من شخصين ، وهي مثال تمهيدي شائع في العديد من كتب نظرية الألعاب. منطق اللعبة بسيط:

  • اتهم اللاعبان في اللعبة بارتكاب جريمة وتم وضعهما في غرف منفصلة حتى لا يتمكنا من التواصل مع بعضهما البعض. (بمعنى آخر ، لا يمكنهم التواطؤ أو الالتزام بالتعاون).
  • يتم سؤال كل لاعب بشكل مستقل عما إذا كان سيعترف بالجريمة أم يلتزم الصمت.
  • نظرًا لأن كل لاعب من اللاعبين لديه خياران (استراتيجيات) محتملة ، فهناك أربعة نتائج محتملة للعبة.
  • إذا اعترف كلا اللاعبين ، فسيتم إرسال كل منهما إلى السجن ، ولكن لسنوات أقل مما إذا تعرض أحد اللاعبين لهز من قبل الآخر.
  • إذا اعترف أحد اللاعبين وظل الآخر صامتًا ، فسيتم معاقبة اللاعب الصامت بشدة بينما يحصل اللاعب الذي اعترف على الحرية.
  • إذا ظل كلا اللاعبين صامتين ، فسيحصل كل منهما على عقوبة أقل شدة مما إذا اعترف كلاهما.

في اللعبة نفسها ، يتم تمثيل العقوبات (والمكافآت ، عند الاقتضاء) بأرقام المرافق. تمثل الأرقام الموجبة نتائج جيدة ، والأرقام السالبة تمثل نتائج سيئة ، والنتيجة أفضل من الأخرى إذا كان الرقم المرتبط بها أكبر. (كن حذرًا من الطريقة التي يعمل بها هذا مع الأرقام السالبة ، حيث أن -5 ، على سبيل المثال ، أكبر من -20!)

في الجدول أعلاه ، يشير الرقم الأول في كل مربع إلى نتيجة اللاعب 1 ويمثل الرقم الثاني النتيجة بالنسبة للاعب 2. تمثل هذه الأرقام واحدة فقط من بين العديد من مجموعات الأرقام التي تتوافق مع معضلة الأسرى.

02 من 04

تحليل خيارات اللاعبين

بمجرد تعريف اللعبة ، فإن الخطوة التالية في تحليل اللعبة هي تقييم استراتيجيات اللاعبين ومحاولة فهم كيفية سلوك اللاعبين. يتخذ الاقتصاديون بعض الافتراضات عند تحليل الألعاب - أولاً ، يفترضون أن كلا اللاعبين يدركان العوائد لكل منهما ولاعب آخر ، وثانياً ، يفترضان أن كلا اللاعبين يتطلعون إلى تحقيق أقصى عائد معقول من المكاسب الخاصة بهم من لعبه.

نهج واحد سهل الأولي هو البحث عن ما يسمى الاستراتيجيات السائدة- الاستراتيجيات الأفضل بصرف النظر عن الاستراتيجية التي يختارها اللاعب الآخر. في المثال أعلاه ، يعتبر اختيار الاعتراف استراتيجية سائدة لكلا اللاعبين:

  • Confess أفضل بالنسبة للاعب 1 إذا اختار اللاعب 2 الاعتراف منذ -6 أفضل من -10.
  • Confess أفضل بالنسبة للاعب 1 إذا اختار اللاعب 2 أن يبقى صامتًا لأن 0 أفضل من -1.
  • Confess أفضل بالنسبة للاعب 2 إذا اختار اللاعب 1 الاعتراف منذ -6 أفضل من -10.
  • Confess أفضل بالنسبة للاعب 2 إذا اختار اللاعب 1 التزام الصمت لأن 0 أفضل من -1.

بالنظر إلى أن الاعتراف هو الأفضل لكلا اللاعبين ، فليس من المستغرب أن تكون النتيجة حيث يعترف كلا اللاعبين بأنها نتيجة توازن للعبة. ومع ذلك ، من المهم أن تكون أكثر دقة مع تعريفنا.

03 من 04

ناش التوازن

مفهوم أ ناش التوازن تم تدوينه من قبل عالم الرياضيات ونظريات اللعبة جون ناش. ببساطة ، يعد Nash Equilibrium مجموعة من أفضل استراتيجيات الاستجابة. بالنسبة إلى لعبة ذات لاعبين ، فإن توازن ناش هو نتيجة حيث تكون استراتيجية اللاعب 2 هي أفضل استجابة لاستراتيجية اللاعب 1 واستراتيجية اللاعب 1 هي أفضل استجابة لاستراتيجية اللاعب 2.

يمكن العثور على إيجاد توازن ناش عبر هذا المبدأ في جدول النتائج. في هذا المثال ، تكون أفضل استجابات اللاعب 2 للاعب الأول محاطة بدائرة باللون الأخضر. إذا اعترف اللاعب 1 ، فإن أفضل استجابة للاعب 2 هي الاعتراف ، حيث أن -6 أفضل من -10. إذا لم يعترف اللاعب 1 ، فإن أفضل استجابة للاعب 2 هي الاعتراف ، حيث أن 0 أفضل من -1. (لاحظ أن هذا المنطق مشابه جدًا للمنطق المستخدم لتحديد الاستراتيجيات السائدة.)

أفضل استجابات اللاعب 1 محاطة باللون الأزرق. إذا اعترف اللاعب 2 ، فإن أفضل استجابة للاعب 1 هي الاعتراف ، حيث أن -6 أفضل من -10. إذا لم يعترف اللاعب 2 ، فإن أفضل استجابة للاعب 1 هي الاعتراف ، حيث أن 0 أفضل من -1.

توازن ناش هو النتيجة حيث توجد دائرة خضراء ودائرة زرقاء على حد سواء لأن هذا يمثل مجموعة من أفضل استراتيجيات الاستجابة لكلا اللاعبين. بشكل عام ، من الممكن أن يكون لديك توازن ناش متعددة أو لا شيء على الإطلاق (على الأقل في استراتيجيات نقية كما هو موضح هنا).

04 من 04

كفاءة توازن ناش

ربما لاحظت أن توازن ناش في هذا المثال يبدو دون المستوى الأمثل (بطريقة محددة ، لأنه ليس باريتو الأمثل) لأنه من الممكن أن يحصل كلا اللاعبين على -1 بدلاً من -6. هذه نتيجة طبيعية للتفاعل الموجود في اللعبة - من الناحية النظرية ، وعدم الاعتراف سيكون استراتيجية مثالية للمجموعة بشكل جماعي ، لكن الحوافز الفردية تمنع تحقيق هذه النتيجة. على سبيل المثال ، إذا اعتقد اللاعب 1 أن اللاعب 2 سيبقى صامتًا ، فسيكون لديه حافز للتخلص منه بدلاً من التزام الصمت والعكس.

لهذا السبب ، يمكن أيضًا اعتبار توازن ناش بمثابة نتيجة حيث لا يوجد لاعب لديه حافز للانحراف من جانب واحد (بمعنى نفسه) عن الإستراتيجية التي أدت إلى تلك النتيجة. في المثال أعلاه ، بمجرد اختيار اللاعبين للاعتراف ، لن يتمكن أي لاعب من تحقيق الأفضل عن طريق تغيير رأيه بنفسه.


شاهد الفيديو: ملف الأسرى الأكثر إلحاحا للفلسطينيين (كانون الثاني 2022).