ש:
כיצד יכול מושג שיווי המשקל ליידע פרויקטים של למידת מכונות?
ת:ככלל, שיווי משקל יודיע על למידת מכונה על ידי חיפוש לייצב סביבות למידת מכונות ויצירת תוצאות עם תערובת תואמת של רכיבים דטרמיניסטיים והסתברותיים.
מומחים מתארים "שיווי משקל" כמצב בו שחקנים רציונליים במערכת למידת מכונות מגיעים להסכמה על פעולה אסטרטגית - בפרט, שיווי המשקל של נאש בתורת המשחקים כרוך בשני או יותר מהשחקנים הרציונליים הללו המגבשים אסטרטגיות בכך שהם מכירים בכך ששום שחקן לא מרוויח על ידי שינוי אסטרטגיה מסוימת אם השחקנים האחרים לא ישנו את שלהם.
הורדה חינם: למידת מכונה ולמה זה חשוב |
הדגמה פופולרית ופשוטה במיוחד של שיווי המשקל של נאש כוללת מטריצה פשוטה בה שני שחקנים בוחרים כל אחד תוצאה בינארית.
האמור לעיל הוא דרך טכנית למדי לתאר שיווי משקל וכיצד הוא עובד. דרך הרבה יותר פורמלית להמחיש את מושג שיווי המשקל, ובמיוחד את הדוגמה לעיל של שני שחקנים רציונליים שכל אחד מהם בחר בבינארי, היא לחשוב על מה שאפשר לכנות "צעד אחד לקראת השני במסדרון התיכון".
נניח ששני אנשים הולכים בכיוונים שונים במסדרון התיכון (או בכל סוג אחר של שטח), שיש בו רק מקום לשני אנשים לרוחב. שני הנתיבים הפתוחים הם התוצאות הבינאריות. אם שני השחקנים הרציונליים בוחרים בתוצאות בינאריות שונות שלא מתנגשות זו עם זו, הם יעברו זה ליד זה ויגידו שלום. אם הם בוחרים בשני תוצאות בינאריות סותרות - הם הולכים באותו מרחב, ואחד מהם יצטרך להניב.
בדוגמה לעיל, אם שני השחקנים הרציונליים בוחרים בשני התוצאות התואמות והלא סותרות, הקונצנזוס הכללי הוא שאף אחד לא מרוויח על ידי שינוי האסטרטגיה שלהם - במקרה זה כיווני ההליכה שלהם - אם האדם האחר לא ישנה את שלהם.
האמור לעיל מהווה שיווי משקל שניתן למודל בכל מבנה לימודי מכונה נתון. בהתחשב בדוגמא הפשוטה הזו, התוצאה תהיה תמיד שני השחקנים הרציונליים שמשתפים פעולה, או במילים אחרות, שני אנשים עוברים זה ליד זה.
ניתן לכנות את ההפך כ"אי-שיוויון "- אם שני השחקנים הרציונליים יבחרו בתוצאות סותרות, כאמור, אחד מהם יצטרך להניב. עם זאת, תוכנית ה- ML שמדגמנת את זה יכולה להיזרק לולאה אינסופית אם שניהם מחליטים להיכנע - כמו שני אנשים לעבור כדי לנסות להכיל אחד את השני ועדיין להמשיך לצעוד לקראת התנגשות.
שיווי משקל כמו זה שלמעלה ישמשו בדרך כלל בלימוד מכונות ליצירת קונצנזוס ולייצוב מודלים. מהנדסים ומפתחים יחפשו את אותם תרחישים ומצבים המפיקים תועלת משווי משקל, ויפעלו לשינוי או טיפול בהם. כשמסתכלים על דוגמאות מהעולם האמיתי המתכתבים עם שיווי משקל של ML, קל לראות כיצד ניתוח מסוג זה במערכת למידת מכונות הוא מאלף באופן ייחודי כדי להבין כיצד ניתן למודל התנהגות אנושית על ידי יצירת שחקנים וסוכנים רציונליים. זו רק דוגמא מצוינת לאופן שבו ניתן להשתמש בשיווי משקל כדי להתקדם ביישום מערכות למידת מכונות.