فوز لعبة ورق مع تعلم الآلة

واحدة من مزايا التعلم الآلي هي أن هناك العديد من الحلول المختلفة. تعتبر الشبكات العصبية مثالية لتحديد النماذج في البيانات وتوفير قدرات تنبؤية مثيرة للإعجاب. يستخدم التعلم المعزز المفاهيم القائمة على المكافأة والتي تتحسن بمرور الوقت. ثم هناك النهج المسمى الخوارزمية الجينية.

تستخدم الخوارزمية الجينية مبادئ تطورية لحل المشكلات. يستخدم مجموعة من الحلول المحتملة للمشاكل ، مع اختيار المرشحين بشكل متكرر واختيارهم حتى يأتي الحل النهائي بعد عدة أجيال.

لإثبات فعالية هذا النهج ، سوف نحل مشكلة معقدة: تطوير استراتيجية للعب لعبة البلاك جاك لعبة ورق (وتسمى أيضًا “21”).

يشير مصطلح “استراتيجية” في هذه الحالة إلى دليل لإجراءات اللاعب التي تغطي جميع المواقف. الهدف هو إيجاد أفضل إستراتيجية ممكنة لتحسين الأرباح مع مرور الوقت.

حول هذه الاستراتيجية “الرابحة”

بالطبع ، ليست هناك استراتيجية رابحة في الواقع – فالقواعد موضوعة بحيث يتمتع المنزل دائمًا بميزة. إذا كنت تلعب لفترة طويلة بما يكفي ، فإنك تخسر المال.

في هذه المعرفة ، فإن أفضل استراتيجية هي التي تقلل من الخسائر. يسمح استخدام مثل هذه الاستراتيجية للاعب بتمديد أمواله إلى أقصى حد ممكن مع أمله في أن يكون محظوظًا على المدى القصير. هذا هو حقا الطريقة الوحيدة لاستخدام لعبة ورق.

كما يمكنك أن تتخيل ، يتعامل علماء الرياضيات وعلماء الكمبيوتر مع لعبة البلاك جاك لفترة طويلة. في الستينيات من القرن الماضي ، كتب عالم الرياضيات ، إدوارد أو ثورب ، كتابًا بعنوان “فاز على تاجر” يتضمن رسومات توضح الإستراتيجية المثالية “الأساسية”.

تبدو هذه الاستراتيجية المثلى كما يلي

تمثل الجداول الثلاثة استراتيجية كاملة للعب لعبة ورق.

الطاولة الكبيرة الموجودة على اليسار مخصصة للأيدي الصلبة ، والجدول الموجود في الأعلى يمينًا للأيدي الناعمة والجدول الموجود أسفل اليمين للأزواج.

إذا لم تكن معتادًا على لعبة البلاك جاك ، فاليد الناعمة هي يد بأس ، يمكن أن يصل العدد إلى 1 أو 11 ، دون أن تتجاوز القيمة الإجمالية لليد 21 عامًا. يشرح الزوجان نفسه ، واليد الصلبة هي كل شيء آخر ، خفضت إلى إجمالي قيمة اليد.

تتوافق الأعمدة في أعلى الجداول الثلاثة مع خريطة التوزيع التي تؤثر على الاستراتيجية. لاحظ أن البطاقات العليا لا تحتوي على جاك أو كوين أو كينج. هذا لأن كل هذه البطاقات تعد 10 وبالتالي يتم تجميعها مع عشرة (“تي”) لتبسيط الجداول.

من أجل استخدام الجداول ، يجب على اللاعب أولاً تحديد ما إذا كان لديه زوج أو يد ناعمة أو صلبة ، ثم ابحث عن الخط المقابل ليده والعمود المقابل للبطاقة في الجدول المقابل للجهة المانحة.

تكون الخلية في الجدول هي “ح” إذا كانت الإستراتيجية المقابلة تستخدم ، إذا تم تنشيط السياسة المقابلة ، “د” لمضاعفة و (فقط في جدول الزوج) “ص” من أجل الانفصال. ،

معرفة الحل الأمثل لمثل هذه المشكلة هو في الواقع مفيد للغاية. توضح مقارنة نتائج اي جي بالحل المعروف فعالية هذه التقنية.

أخيرًا ، لا يزال هناك شيء يجب القيام به قبل أن نمضي قدمًا ، فكرة اللانتمينية. أي إذا تم تنفيذ نفس كود اي جي مرتين على التوالي ، فسيتم إرجاع نتيجتين مختلفتين. يحدث هذا مع الخوارزميات الجينية بسبب العشوائية المتأصلة فيها. من غير المعتاد أن يقوم البرنامج بهذا ، لكن في هذه الحالة ، هذا جزء فقط من النهج.