מִידָּה כְּנֶגֶד מִידָּה (Tit for Tat)

גְּמוּל לְפִי הַמַּעֲשֶׂה, תַּשְׁלוּם לְאִישׁ לְפִי הַמַּגִּיעַ לוֹ (אבן שושן).

Tit for Tat היא אסטרטגיה בתורת המשחקים.

עיינו בסעיף 2.1 (אסטרטגיה של קשרי גומלין) בספר תבונה ורגישות בניהול; סעיף 2.9 (היבטים מעשיים בתורת המשחקים) בספר תבונה ורגישות בניהול.

פרופ' רוברט אקסלרוד מאוניברסיטת אן-ארבור במישיגן ארה"ב, עסק בחקר אסטרטגיות של תורת המשחקים. בשנת 1980 הוא ארגן סדרה של תחרויות בין האסטרטגיות השונות, כדי לבחון את התועלות שתצמחנה מהשימוש באסטרטגיות שונות.

לצורך העניין, תכנן פרופ' אקסלרוד תכנית מחשב שידעה לממש את משחק דילמת האסיר האיטרטיבית. ניתן היה להגדיר אסטרטגיה של משחק לכל העתק של תכנית מחשב. האסטרטגיה קבעה את התנהגות התוכנה:
שיתוף פעולה (1) או בגידה (0).

במהלך משחק בין שתי תכניות מחשב כאלה, מציגה כל תכנית את ההתנהגות שלה (1 או 0 – שיתוף פעולה או בגידה). שילוב שתי ההתנהגויות מוסיף או גוֹרֵעַ נקודות מהסכום שהצטבר בכספת של כל תכנית מחשב בנפרד, על פי טבלת האמת משמאל:

תוצאות הניקוד מתוארות בסוגריים. ניקוד (0, 10+) למשל, מציין כי שחקן ב' זכה ב-10 נקודות בעוד ששחקן א' לא זכה בנקודות. ניקוד (5-, 5-) מציין כי 5 נקודות נלקחו מהכספת של שני השחקנים. דוגמאות אחדות של אסטרטגיות:

  • אסטרטגיה של בגידה קבועה, ללא קשר לתוצאות משחקים קודמים;

  • אסטרטגיה של שיתוף פעולה קבוע, ללא קשר לתוצאות משחקים קודמים;

  • תגובה אקראית. במהלך המשחק בוחרת התכנית לבגוד או לשתף פעולה, ללא קשר לתוצאות משחקים קודמים;

  • אסטרטגיה של מידה כנגד מידה - Tit For Tat. התכנית בוחרת באסטרטגיה של שיתוף פעולה עם שחקן שלא שיחקה עימו קודם לכן, בכל משחק ראשון. במשחקים הבאים עם אותו שחקן בוחרת התכנית בהתנהגות הקודמת של השחקן שניצב מולה.

  • אסטרטגיה מפוייסת של מידה כנגד מידה. בשני המשחקים הראשונים עם שחקן חדש משתפת התכנית פעולה. במשחקים השלישי ואילך עם אותו שחקן בוחרת התכנית בהתנהגות הקודמת של השחקן שניצב מולה;

  • אסטרטגיות נוספות, מורכבות יותר.

פרופ' אקסלרוד שיכפל את תכנית המחשב מספר רב של פעמים ולכל העתק הוא סיפק קוד זיהוי ייחודי. את העתקי תכניות המחשב שלח לעמיתיו המקובלים כמומחים במגוון של תחומים (מדעי המחשב, מדעי המדינה, מדעי ההתנהגות, פסיכולוגיה, כלכלה, ביולוגיה וכדומה). הוא ביקש מכל אחד מהמומחים להגדיר אסטרטגיה ייחודית. בתחילת תהליך ההדמייה עמדו לרשותו העתקים של תכניות הטעונות באסטרטגיות השונות. כל העתק של תוכנה נקרא על שם השחקן שהגדיר את האסטרטגיה שלו (מייק, דנה וכו').

במהלך הניסוי "הפגיש" אקסלרוד זוגות של שחקנים שיודעים לזהות האחד את השני ויודעים גם כיצד הם הגיבו במפגשים קודמים ביניהם, אם היו כאלה. מפגש דנה-מייק, למשל, מתנהל באופן הבא, כאשר שני השחקנים מבצעים את הפעולות הבאות – במקביל וללא תיאום:

על פי טבלת האמת (אשר מושפעת משילוב החלטות שני השחקנים בצעד 3), מתווספות או נגרעות נקודות מהכספת של כל אחד.

בסך הכול התנהלו 200 משחקים בין כל זוג תוכניות מחשב. האסטרטגיה הזוכה הייתה זו שבכספת שלה יצטברו מירב הנקודות בתום כל המשחקים.

האסטרטגיה המנצחת בטורניר אקסלרוד, הייתה מידה כנגד מידה.

אסטרטגיות תוקפניות גרמו לפגיעה הדדית ולהישגים נמוכים. אסטרטגיות פשרניות נוצלו על ידי האסטרטגיות התוקפניות והגיעו אף הן להישגים נמוכים. את האסטרטגיה המנצחת הגיש המתמטיקאי הקנדי ד"ר אנטול רפופורט. בטורנירים נוספים שנערכו מדי שנה בהמשך, המשיכה Tit for Tat לככב, למרות שמדי שנה הצטרפו אסטרטגיות משוכללות יותר.

הלקח החשוב ביותר של פרופ' אקסלרוד (1981 The Evolution of Cooperation,) מהישגיה של אסטרטגית Tit for Tat היה כי, ככל הנראה, שיתוף פעולה עדיף על בגידה, כאשר צפוייה עבודה משותפת במשך פרק זמן בלתי מוגבל (מספר בלתי מוגבל של משחקים), וכאשר ההתנהגות הקודמת של השחקנים נלקחת בחישוב.

פרופ' אקסלרוד טוען כי אסטרטגית Tit for Tat מקיימת ארבע תכונות שחייבות להתבטא בכל אסטרטגיה יעילה:

  • בהירוּת (האסטרטגיה ברורה ופשוטה למימוש);

  • סלחנוּת (אינה מנציחה עוינות ותמיד נכונה לחזור לשיתוף פעולה).

  • נחמדוּת (אינה יוזמת בגידה);

  • תגובתיוּת (מגיבה באופן מידי לבגידה);

הרווח הגדול (בטווח הקצר ובאירוע חד פעמי) במשחק דילמת האסיר מתקיים דווקא בבגידה, כאשר הצד השני פראייר (משתף פעולה).

המושג "בגידה" אינו קיים בלקסיקון של אסטרטגית Tit for Tat ולכן אסטרטגיה זו אינה יכולה להוביל לרווח הגדול במפגש חד פעמי.

התופעה המפליאה באסטרטגית Tit for Tat מתבטאת בעובדה שלמרות שלעולם אינה מובילה לניצחון במשחק בודד, היא זוכה בניקוד הגבוה ביותר בטווח הארוך, כאשר מנהלים מספר רב של משחקים.

הסיבה שהאסטרטגיה הזו זכתה בטורניר נובעת מיכולתה לעודד שיתופי פעולה ולהתחמק מניצול.

ביקורת על אסטרטגית Tit for Tat

בספרם Thinking Strategically (תורת המשחקים - מבוא לחשיבה אסטרטגית, 2006) טוענים פרופ' אבינַש דיקְסיט, ופרופ' ברי ניילבּאף כי אסטרטגית Tit for Tat לקויה.

 

בעולם הוירטואלי של הטורניר הממוחשב, אין מקום לטעויות או לפרשנויות הקשורות להתנהגות השחקן האחר.

 

לעומת זאת, בעולם האמיתי עלולות להתרחש טעויות (בהבנת התנהגות הצד השני).

פרשנויות שגויות בהבנת התנהגות הצד האחר, עלולות  להוביל לתוצאות הרסניות.

התגובה המיידית של האסטרטגיה עלולה לגרור את השחקנים ממצב של שיתוף פעולה ממושך לתהליך אין סופי של עימותים ובגידות.

 

התרשים הבא ממחיש את כשל התגובה המהירה מדי של האסטרטגיה.

תהליכי שיתוף הפעולה ימשיכו כל עוד השחקנים מפרשים את התנהגות הצד האחר כשיתוף פעולה (צעדים 1-2-3 בתרשים). אולם כאשר שחקן א' מפרש בטעות את פעולה 4 כבגידה, הוא מגיב בענישה (צעד 5).

על פי מתכונת הפעולה והתגובה של אסטרטגית Tit for Tat, יגיב שחקן ב' בתוקפנות. החל מרגע זה, שני הצדדים לכודים במעגל איבה.

מעגל איבה אינו יכול להסתיים באמצעות המתכונת המקורית של מידה כנגד מידה.

מנגנוני הפעולה והתגובה של רוסיה וצ'צניה, ישראל והפלשתינאים, בריטניה ואירלנד מעידים על כך. בגלל הסיכוי לפרשנות שגוייה, צריך להיות סלחנים מעבר למתכונת המקורית של Tit for Tat ולהשתמש בגישה אסרטיבית.

 

שימו לב שהאסטרטגיה הזו אינה מתגמלת על שיתוף פעולה אלא מגיבה בעונש על בגידה. הענשה מהירה מדי, כפי שראינו, עלולה לשמש כחרב פיפיות.

אבינַש וניילבּאף מציעים חלופות לעין תחת עין, אשר מתחשבות בהיסטוריה של הצד השני בטווח הקרוב, הבינוני והרחוק. הם הגדירו מערכות של חוקים ותנאים להענשה.

הבעיה שנותרה פתוחה היא שעל פי המתכונת הזו, אין הבחנה בין פגיעה במזיד (במטרה לשקר) לבין פגיעה בשוגג (הנובעת מפרשנות שגוייה של כוונה טובה). עדיין מתקשים להגדיר טכניקה אוטומטית ליישוב סיכסוכים.

צריך לזכור כי גורמי הסיכסוכים הם הרגשות אשר מניעים את האנשים לפעולה. ולכן, הדרכים המקובלות (והבלתי מושלמות) הן להיעזר בִּמְגַשֵּׁר נייטרלי ולנקוט בצעדים בוני אמון, כאשר הסיכסוך קיים.

הדרך הקלה היא לנקוט בהליכי הבטחת אמון (סעיף 1.6) עוד לפני פרוץ הסיכסוך, כאשר עדיין קיים שיתוף פעולה, כדי לצמצם את הסיכוי לטעויות. לצורך זה נדרש להסתייע בצעדי פיקוח וביקורת כדי להימנע מפרשנויות שגויות (תבונה ורגישות בניהול, סעיף 6.5 - מימוש גישת Win3).

גישת מעגלי פעולה מנטרלת, למעשה, את החולשה הזו של Tit for Tat והופכת את שתי הגישות למשלימות.