תוכן עניינים:
הגדרה - מה המשמעות של Overfitting?
בסטטיסטיקה ולמידת מכונה, התאמת יתר מתרחשת כאשר מודל מנסה לחזות מגמה בנתונים רועשים מדי. התאמת יתר היא תוצאה של מודל מורכב מדי עם יותר מדי פרמטרים. מודל שמוגזם מדי אינו מדויק מכיוון שהמגמה אינה משקפת את מציאות הנתונים.
Techopedia מסביר Overfitting
מודל מוגזם מדי הוא מודל עם קו מגמה המשקף את השגיאות בנתונים איתם אימן במקום לחזות במדויק נתונים לא נראים. ניתן לראות זאת בצורה חזותית יותר עם גרף של נקודות נתונים וקו מגמה. דגם מצויד יתר על המידה מראה עקומה עם נקודות גבוהות ותחתונות, ואילו מודל המותאם כראוי מראה עקומה חלקה או רגרסיה לינארית.
הבעיה העיקרית עם התאמת יתר היא שהמודל שינן ביעילות נקודות נתונים קיימות במקום לנסות לחזות עד כמה יהיו נקודות נתונים בלתי נראות.
יתר על המידה נובע ממספר מוגזם של נקודות אימון. ישנן מספר טכניקות בהן יכולים חוקרי למידת מכונה להשתמש בכדי להקל על התאמת יתר, כולל אימות צולבים, סדירות, עצירה מוקדמת, גיזום, קודמות בייסיאנית, נשירה והשוואה בין דגמים.