שְׁאֵלָה:
האם יש מנוע שמוצא את המהלך ה"פרקטי "הטוב ביותר?
Ari
2019-10-03 06:26:11 UTC
view on stackexchange narkive permalink

מנוע שחמט סטנדרטי ימצא את המהלך שהוא רואה הכי טוב בהנחה שמשחק הכי טוב משחק. אך מהלך זה עשוי להוביל ליתרון לא מבוטל או לקו מסובך שיכול לגרום בקלות לטעויות עבור שחקן אנושי בעל יכולת ספציפית. האם יש תוכנית שמוצאת את המהלך ה"פרקטי "הטוב ביותר עבור למשל שחקני ביניים? לדוגמא, היא עשויה לבחור במהלך שמוביל למצב התקפה חזק מאוד שבו ככל הנראה היריב יטעה, למרות שניתן יהיה להגן עליו במשחק מושלם.

שאלה מעניינת מאוד, אך לדעתי יישום דבר כזה יכול להיות קשה מכיוון ש"פרקטי "יכול להיות שונה מאוד בהתאם למצב. לדוגמא, האם אותו מהלך יהיה מעשי באותה מידה מול יריב 200 נקודות מעל ו 200 נקודות מתחת? מה לגבי משחק קלאסי לעומת בליץ?
נראה שאתה רוצה משהו קרוב יותר ל- expectimax מאשר ל- minimax?
זה מזכיר לי פוקר. אני חושב שרוב הפוקוטים תמיד משחקים מהלכים מעשיים במקום להניח [שיווי משקל נאש] (https://en.wikipedia.org/wiki/Nash_equilibrium) ולנסות לשחק מהלכים תיאורטיים הטובים ביותר.
אחת הדרכים לחשוב על זה היא שאתה מחפש לכמת פונקציה אובייקטיבית אחרת. כשאתה מפסיד, אתה לא רוצה למזער רק את הסכום שאתה מפסיד על ידי (למי אכפת אם אתה מפסיד על ידי חצי רגל או מלכה). במקום זאת, אתה רוצה למזער את הסכום שאתה מפסיד, בכפוף לכך שעדיין יהיה קו שהיריב שלך יכול ליפול עליו באופן סביר. אתה יכול לכמת "ליפול באופן סביר" על ידי ספירת "רק" מהלכים או מצבים שרק המהלך העליון (או שניים) ממשיך את היתרון שלהם, אך מהלכים אחרים מובילים לכך שיש לך את היתרון.
כאנלוגיה, בכדורגל האמריקאי אתה בועט במקום כי זה נותן לך הזדמנות (רזה) להבקיע במהירות למרות שהתוצאה הצפויה תגרום לך להחמיר.
חכה רגע ... אתה לא מנסה ליצור מנוע שמאפשר לך לרמות ברשת מבלי שיבחין לך, נכון? כי זה מאוד תופעת לוואי אפשרית אחת של מנוע כזה.
פול- אני לא מסכים. פוקר הוא במידה רבה אחוזים.
ddunn-לגמרי לא מסכים. בעיטה של ​​הצד בדרך כלל נעשית כי המצב מעדיף אותה. בעיטות מהמקום מתאוששות בכ- 11%, כך שמשמעותן היא שמשמשים כמעט תמיד כאשר הסיכוי לזכות הוא פחות מ- 11%. יוצאי הדופן הם נדירים. OP שואלת לגבי מצב ספציפי שבו הוא יכול 'להזמין' את היריב לטעות. זה יהיה מקביל יותר למשהו כמו בליץ אזור.
שְׁלוֹשָׁה תשובות:
Allure
2019-10-03 06:35:59 UTC
view on stackexchange narkive permalink

אתה מתאר משהו שדומה מאוד ל בוז. הרעיון בבוז הוא שאם תשמור על יותר דינמיות בעמדה, יריב חלש יותר יעשה טעויות שתוכל לנצל. לכן, בהינתן שני מהלכים שמניבים הערכות דומות, מנוע עם ציון זלזול גבוה יבחר בזה ששומר יותר דינמיות במצב. המנועים המסורתיים החזקים ביותר כיום מיושמים בוז (דוגמה ל- Komodo).

סכנת הבוז היא, כנגד יריב חזק, בוז גבוה יכול לגרום לך להיהרג - אתה הרי מכריח את המנוע לבצע מהלך חלש יותר רק כדי לשמור על המשחק בחיים.

תודה, זה דומה למה שאני מחפש, אבל השאלה שלי היא אפילו לשחקנים בעלי אותה יכולת. לדוגמא, מהלך אחד עשוי להוביל לניצחון 9/10 פעמים בהתחשב במהלכים האפשריים שהיריב יבצע.
@Ari זה דומה. קח שני מהלכים, אחד מהם יוביל לתיקו והשני עשוי להוביל לניצחון 90% מהזמן ולהפסד ב -10% הנותרים מהזמן. מנוע עם הגדרת בוז גבוהה מאוד עשוי לבחור את האחרון (ולהפסיד מול הגנה מושלמת).
ללא זלזול מנועי כנראה היו משווים את רוב המשחקים נגד יריבים נחותים על ידי אי-הכללת חזרות מאולצות בשום שלב.
יכול להיות טוב מאוד אם נגמר הזמן לשחקן השני בשעונו.
@Ari אם היריב שלך נמצא באותה רמה כמוך, אז אם אתה יכול לעשות ניתוח מטא של קו (כלומר, לא רק להחליט אם הוא מנצח, אלא להעריך כמה הסיכויים שיריבך יראה שהוא מנצח), אז הם ' כנראה שאוכל לנתח את זה.
כמו כן, אם המטרה שלך היא להיות שחקן שחמט טוב יותר, אז ההישענות על משחק מזלזל כנראה תהיה בסופו של דבר יותר קביים מכל דבר אחר. סוערת ואומץ יכולות לקחת אותך רק כל כך רחוק לפני שאתה באמת צריך להתחיל לחדד את כישורי הליבה שלך.
Ari
2019-10-03 09:16:55 UTC
view on stackexchange narkive permalink

הבנתי ששאלה זו חלה בעיקר על מנועי שחמט סטנדרטיים המשתמשים בפונקציות מינימקס להערכת מהלכים. עם זאת מנועי שחמט כמו אלפאזרו משתמשים בחיפוש עץ מונטה קרלו כדי לדמות משחקים רבים ושונים כך שהם לא רק מסתכלים על המהלכים הטובים ביותר האפשריים. יתכן שכבר ניתן היה להשתמש בהם כדי למצוא את המהלך ה"מעשי "הטוב ביותר, או להתאים אותם למטרה זו. לדוגמא ניתן לעדכן את אלגוריתם החיפוש של מונטה קרלו בכדי לבחון מהלכים "סבירים" ולדמות מה קורה.

קישור רלוונטי https://en.chessbase.com/post/komodo-mcts-the-boa-constrictor-approach
אבל אז אתה צריך לתכנת "סביר" באלגוריתם.
Savage47
2019-10-05 12:00:50 UTC
view on stackexchange narkive permalink

לא ממש.

מאגרי מידע שימושיים מכיוון שהם יכולים לספר לך לעתים קרובות משחק מהלך ומה התוצאה אולם הם אינם מושלמים ממגוון סיבות.

לפריץ 12 (לא בטוח לגבי גרסאות מאוחרות יותר) יש מד "חום" שמספר לך כמה וריאציה מורכבת.

שורה תחתונה. זה שילוב של דברים. אתה מחפש מהלכים שבהם המהלכים העקרוניים ביותר מתבררים רעים. אף מנוע לא יכול להגיד לך את זה.



שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 4.0 עליו הוא מופץ.
Loading...