Extensive Form Game
Transcription
Extensive Form Game
Extensive Form Game “Burn the Boats” “let’s burn the • לעיתים אנחנו שומעים את הביטוי ? מה הכוונה.boats” B – לוותר על אלטרנטיבה A – ובכך לא להותיר ברירה ולנסות להשיג • Paradox of commitment • It is by limiting my own options that I can manage to influence the rival’s course of actions in my interest. Hernan Cortes and the Aztecs • From a good Spanish family. – Failed at being a European soldier. – Failed at becoming a lawyer. Cortes was hungry for wealth and recognition. Cortes • 1519 – landed on the coast of Mexico with : – 600 men, 16 horses, and a few cannon. • WHY WOULD CORTES BURN HIS SHIPS WHEN HE GOT TO THE NEW WORLD? Think of Cortes trying to motivate his own soldiers Fight Hard Keep Ships C S Be careful S Fight Hard C = 100, S = 0 C = 0, S = 10 C = 100, S = 0 Burn ships Be careful C = -100, S = -100 5 If no retreat possible, will fight hard or die. But if retreat is possible, may fight less hard and ‘run away’ Fight Hard Keep Ships C S Be careful S Fight Hard C = 100, S = 0 C = 0, S = 10 C = 100, S = 0 Burn ships Be careful C = -100, S = -100 6 So Cortes wants to burn his ships. It is a credible commitment not to retreat – and this alters how his own troops behave. Fight Hard Keep Ships C S Be careful S Fight Hard C = 100, S = 0 C = 0, S = 10 C = 100, S = 0 Burn ships Be careful C = -100, S = -100 7 Burn the boats עוד על ?• היכן נתקלנו בזה עד כה ובכך ביטולsteal - – התחייבות לGolden Balls – split -האופציה ל chicken game -– עקירת ההגה ב • Business guru, Tom Peters swears by Cortés’ destructive strategy by going so far as to suggest that every company hire a CDO – a Chief Destructive Officer. מימד הזמן Extensive Form Game - • מימד הזמן וסדר הפעולות -מרכיב משמעותי בניתוח משחק • תצוגת ה normal form game -לא משלבת שום מרכיב של סדר הפעולות ) (sequenceאו זמן – השחקנים פועלים בו זמנית • תצוגת ה extensive form game -הינה אלטרנטיבה שמייצגת גם את המרכיב הטמפורלי שבמשחק – perfect information extensive-form games – imperfect-information extensive-form games Perfect Information Extensive Form Game • A (finite) perfect-information game (in extensive form) is defined by the tuple (N ; A ; H ; Z ; χ ; ρ ; σ ; u), where: – Players: N – Actions: A – Choice nodes and labels for these nodes: • Choice nodes: H • Action function: χ : H → 2A assigns to each choice node a set of possible actions • Player function: ρ : H → N assigns to each non-terminal node h a player iϵN who chooses an action at h – . Perfect Information Extensive Form Game • A (finite) perfect-information game (in extensive form) is defined by the tuple (N ; A ; H ; Z ; χ ; ρ ; σ ; u), where: – Terminal nodes: Z is a set of terminal nodes, disjoint from H – Successor function: σ : HxA → H U Z maps a choice node and an action to a new choice node or terminal node such that for all h1,h2 ϵ H and a1,a2 ϵA, if σ(h1,a1) = σ(h2,a2) then h1 = h2 and a1 = a2 • Choice nodes form a tree: nodes encode history – Utility function: u = (u1,…,un); ui : Z → 𝑅 is a utility function for player i on the terminal nodes Z . דוגמה – The Sharing Game • אח ואחות צריכים לחלק ביניהם 2דולר • האח מתחיל • אם האחות לא מסכימה אז שניהם מקבלים 0 אסטרטגיות • כמה אסטרטגיות טהורות יש לכל שחקן במשחק? – לשחקן 1יש 3אסטרטגיות )(2-0,1-1,0-2 – לשחקן 2יש )2^3( 8אסטרטגיות אסטרטגיה טהורה -הגדרה • אסטרטגיה טהורה של שחקן בperfect - information gameהיא הגדרה מלאה של הפעולה בה ינקוט עבור כל צומת ) (nodeהשייכת לשחקן זה דוגמה • מהן האסטרטגיות הטהורות של שחקן ?2 })– S2 = {(C,E),(C,F),(D,E),(D,F • מהן האסטרטגיות הטהורות של שחקן ?1 במצב זה לא נגיע לעולם ל H -אבל עדיין האסטרטגיה הטהורה )(A,H שונה מ(A,G) - })– S1 = }(B,G),(B,H),(A,G),(A,H ש"מ נאש • על-בסיס הגדרת האסטרטגיה הטהורה ,ניתן להגדיר מחדש גם: – אסטרטגיות מעורבות – Best response – ש"מ נאש המרת המשחק לNormal Form - • ניתן להמיר את ה extensive form game -ל- normal form gameבצורה יחסית קלה חשיבות: כל התוצאות/הוכחות שהתקיימו ב- יתקיימו גם בnormal form game - extensive form יתרונות הextensive form game - • מאפשר לייצג משחקים שיש בהם אלמנט של זמן • מאפשר לייצג משחקים בצורה קומפקטית: – משחקים עם הרבה פעולות – מונע חזרה של מצבים (למשל בדוגמה הקודמת היינו צריכים payoff pairs 16בעוד שבאמצעות הextensive - formמספיק לנו 5 • אבל... – לא כל משחק ניתן לייצג כ( extensive form -כלומר, המעבר מ normal form -ל extensive form -לא תמיד מתקיים) – דוגמה – matching pennies ש"מ בExtensive Form - • נובע מכך שאנחנו עובדים בצורה סדרתית )(sequential • שימ/י לב!!! המשפט נכון אך ורק לperfect - ( information extensive form gameכבר ראינו שב- normal formיש מצבים שבהם אין ,PSNEלמשל ב- )matching pennies • האם יש טעם להשתמש באסטרטגיה מעורבת ב- ?perfect information extensive form game – לא! כי ממילא השחקן השני רואה מה עשינו (אני לא מרוויח כלום מה)randomization - המרת המשחק לNormal Form - • מהם שיוויי המשקל על בסיס אסטרטגיות טהורות במשחק? Subgame Perfection • ש"מ ) (BH,CEקצת מוזר – למה ששחקן 1ישחק Hאם יש לו גם את האלטרנטיבה ?G – למעשה הבחירה ב H -היא האיום ששומר עלינו בש"מ – שחקן 2יודע שאם יבחר ב F -אז שחקן 1יבחר ב H -ולכן עדיף לו לבחור בE - – אבל האמנם זה איום אמין? האם באמת שחקן 1יפעל כך ברגע האמת? הגדרה פורמלית אםG שלsubgame perfect equilibrium הואs • - לs הנגזרת של,G שלsubgame G’ ורק אם לכל G’ שלNash equilibrium היאG’ דוגמה Subgame G’ ( הוא לאBH,CE) היא לא ש"מ נאש ולכן הפיתרוןH הזה הפעולהsubgame -ב subgame perfect equilibrium נקודות נוספות • מכיוון ש G -הוא גם subgameשל עצמו אז כל SPE הוא גם .NE • ההגדרה הנוכחית פוסלת איומים לא אמינים non- credible threats subgame perfect האם יש לנו ? במשחקequilibrium off path ( נקראתAH,CF) - בH • האסטרטגיה Backward Induction subgame perfect equilibrium -• דרך לחישוב ה של משחק all leaf nodes set of all actions available to player at that node vector denoting the utility for each player דוגמה – Centipede game • מהו ה?subgame perfect equilibrium - – שחקן 1בוחר Dכבר בתור הראשון • תוצאה זו היא Pareto-dominatedעל-ידי כל התוצאות האחרות (מלבד השניה) • האם אנשים ישחקו לפי ש"מ זה? • מה צריך שחקן 2לעשות אם שחקן 1בחר ?Aלפי הSPE - עליו לבחור D – אבל גם שחקן 1היה צריך לבחור Dלפי היגיון זה .אז אולי שחקן 1משחק בצורה לא רציונלית? – הנושא נחקר רבות בספרות Example: Mini Ultimatum Game • Proposer (Player 1) can suggest one of two splits of £10: (5,5) and (9,1). • Responder (Player 2) can decide whether to accept or reject (9,1), but has to accept (5,5). Reject leads to 0 for both Player 1 (9,1) (5,5) Player 2 a r 91 0 0 55 Mini Ultimatum Game in Strategic Form Player 1 • • propose (5,5) propose (9,1) Player accept (9,1) 5,5 9,1 2 reject (9,1) 5,5 0,0 There are two equilibria: 1. (propose (9,1), accept (9,1)) 2. (propose (5,5), reject (9,1)). Equilibrium 2 is in weakly dominated strategies (reject (9,1) is weakly dominated) Example: Mini Ultimatum Game • There is one subgame of length 1, following (9,1) Player 1 (9,1) (5,5) Player 2 a r 91 0 0 55 Example: Mini Ultimatum Game • There is one subgame of length 1, following (9,1) • The optimal action is accept Player 1 (9,1) (5,5) Player 2 a r 91 0 0 55 Example: Mini Ultimatum Game • There is one subgame of length 1, following (9,1) • The optimal action is accept • There is one subgame of length 2, the whole game Player 1 (9,1) (5,5) Player 2 a r 91 0 0 55 Example: Mini Ultimatum Game • • • • There is one subgame of length 1, following (9,1) The optimal action is accept There is one subgame of length 2, the whole game Taking “accept” in the subgame of length 1 as given, we see that (9,1) is optimal Player 1 (9,1) (5,5) Player 2 a r 91 0 0 55 Extensive Form Games with Perfect Information Example (172.1) 1 C E D 2 2 2 F G J H K I 3,0 1,0 1,1 2,1 2,2 1,3 Extensive Form Games with Perfect Information Example (172.1) Player 2 Optimal Strategies: (FHK),(FIK),(GHK),(GIK) 1 C E D 2 2 2 F G J H K I 3,0 1,0 1,1 2,1 2,2 1,3 Extensive Form Games with Perfect Information Player 2 Optimal Strategies: (FHK),(FIK),(GHK),(GIK) Example (172.1) 1 Player 1 Best Responses: (C),(C),(C or D, or E),(D) C E D 2 2 2 F G J H K I 3,0 1,0 1,1 2,1 2,2 1,3 Extensive Form Games with Perfect Information Player 2 Optimal Strategies: (FHK),(FIK),(GHK),(GIK) Strategy Pairs: (C,FHK), (C,FIK), (C,GHK), (D,GHK), (E,GHK), (D,GIK) 1 Player 1 Best Responses: (C),(C),(C or D, or E),(D) C E D 2 2 2 F G J H K I 3,0 1,0 1,1 2,1 2,2 1,3 Example: Voting for a Payraise Three legislators are voting on whether to give themselves a pay raise. All three want the pay raise; however, Each face a small cost in voter resentment c>0. The benefit for the raise is greater than cost: b>c They vote in the order 1-2-3. Simple majority rule What is the outcome obtained by backward induction? (N; NY; nyyn) Diagram courtesy: Dr. Tayfun Sönmez