בית שמע כיצד יכולים המהנדסים להעריך מערכי אימונים ומערכות בדיקה כדי לאתר התאמה יתר אפשרית בלימוד מכונות?

כיצד יכולים המהנדסים להעריך מערכי אימונים ומערכות בדיקה כדי לאתר התאמה יתר אפשרית בלימוד מכונות?

Anonim

ש:

כיצד יכולים המהנדסים להעריך מערכי אימונים ומערכות בדיקה כדי לאתר התאמה יתר אפשרית בלימוד מכונות?

ת:

כדי להבין כיצד הדבר נעשה, יש צורך להבין את התפקידים של מערכי נתונים שונים בפרויקט טיפוסי למידת מכונה. מערך ההדרכה מוגדר בכדי לתת לטכנולוגיה מסגרת התייחסות - קו נתונים המשמש את התוכנית לקבלת החלטות חזויות והסתברותיות. ערכת הבדיקה היא המקום בו אתה בודק את המכונה על נתונים.

התאמה יתר היא תסמונת בלימוד מכונות בה הדגם אינו מתאים לחלוטין לנתונים או למטרה.

הורדה חינם: למידת מכונה ולמה זה חשוב

אחת מהמצוות הרחבות של למידת מכונה היא שנתוני הדרכה ונתוני מבחן צריכים להיות ערכות נתונים נפרדות. קיימת הסכמה רחבה למדי בנושא זה, לפחות ביישומים רבים, בגלל כמה בעיות ספציפיות בשימוש באותה מערכת שבה השתמשת לאימונים לבחינת תוכנית למידת מכונה.

כאשר תוכנית למידת מכונה משתמשת במערך אימונים, שאפשר לכנותו למעשה מערך תשומות, היא מפעילה את מערך ההדרכה הזה כדי לקבל החלטות לגבי תוצאות ניבוי. דרך אחת בסיסית מאוד לחשוב על זה היא שערכת ההדרכה היא "האוכל" לתהליך המחשוב האינטלקטואלי.

כעת כאשר אותה קבוצה משמשת לבדיקה, המכונה יכולה לעתים קרובות להחזיר תוצאות מצוינות. הסיבה לכך היא שכבר ראתה נתונים אלה לפני כן. אבל כל המטרה של למידת מכונה במקרים רבים היא להביא תוצאות לגבי נתונים שלא נראו עד כה. תוכניות ללימוד מכונות לשימוש כללי מיועדות להפעלה על מערכי נתונים מגוונים. במילים אחרות, העיקרון של למידת מכונה הוא גילוי, ולרוב אינך מקבל כמות גדולה מכך על ידי שימוש במערך אימונים ראשוני למטרות בדיקה.

בהערכת מערכי אימונים ומערכות בדיקות להתאמת יתר אפשרי, מהנדסים עשויים להעריך תוצאות ולברר מדוע תוכנית עשויה לעשות זאת בצורה שונה על התוצאות ההשוואתיות של שני מערכות אלה, או במקרים מסוימים כיצד המכונה עשויה להסתדר טוב מדי על נתוני האימונים עצמם. .

בתיאור יכולתי של כמה מהבעיות הללו בלימוד מכונה במאמר משנת 2014, ג'ייסון בראונלי מבית Machine Learning Mastery מתאר התאמה יתר על המידה באופן הזה:

"מודל שנבחר לרמת הדיוק שלו במערך האימונים ולא ברמת הדיוק שלו במערכת נתונים של מבחן שטרם נראתה, סביר מאוד שיש לו דיוק נמוך יותר במערך מבחן בלתי נראה", כותב בראונלי. "הסיבה היא שהמודל אינו ככלל. הוא הספקטרליזציה למבנה במערך האימונים (נטוי נטוי). זה נקרא התאמה יתר וזה יותר מגוחך ממה שאתה חושב."

במונחים שגרתיים, אפשר לומר שבמומחיותה של מערך נתוני האימונים התוכנית הופכת לנוקשה מדי. זוהי דרך מטפורית נוספת לבדוק מדוע תוכנית ללימוד מכונה אינה משמשת באופן אופטימלי באמצעות מערך ההדרכה של מערך המבחנים. זו גם דרך טובה לגשת להערכת שני מערכות שונות אלה, מכיוון שהתוצאות יראו למהנדסים הרבה על אופן פעולתה של התוכנית. אתה רוצה פער קטן יותר בין הדיוק לשני הדגמים. אתה רוצה לוודא שהמערכת לא מוגזמת או "ממוזגת דיוק" למערכת נתונים מסוימת, אך היא כללית יותר ומסוגלת לצמוח ולהתפתח לפי פקודה.

כיצד יכולים המהנדסים להעריך מערכי אימונים ומערכות בדיקה כדי לאתר התאמה יתר אפשרית בלימוד מכונות?