ש:
מהי דרך פשוטה לתאר הטיה ושונות בלימוד מכונות?
ת:ישנן מספר דרכים מורכבות לתאר הטיה ושונות בלימוד מכונות. רבים מהם משתמשים במשוואות מתמטיות מורכבות משמעותית ומראים באמצעות גרפים כיצד דוגמאות ספציפיות מייצגות כמויות שונות של הטיה וגם שונות.
הנה דרך פשוטה לתאר הטיה, שונות ואת ההטיה / סחירות של סחר בלימוד מכונות.
בבסיסה ההטיה היא פישוט יתר. זה יכול להיות חשוב להוסיף להגדרת הטייה איזו הנחה או שגיאה מניחה.
אם תוצאה מוטה מאוד לא הייתה בטעות - אם היא הייתה על הכסף - היא תהיה מדויקת ביותר. הבעיה היא שהמודל המפשט מכיל שגיאה מסוימת, כך שהוא לא נמצא בעין השור - השגיאה המשמעותית כל הזמן חוזרת על עצמה או אפילו מתגברת ככל שתוכנית הלמידה של המכונה עובדת.
ההגדרה הפשוטה של שונות היא שהתוצאות מפוזרות מדי. לרוב זה מוביל לסיבוכיות יתר של התוכנית ולבעיות בין מערכות מבחן ואימונים.
שונות גבוהה פירושה ששינויים קטנים יוצרים שינויים גדולים בתפוקות או בתוצאות.
דרך נוספת פשוט לתאר את השונות היא שיש יותר מדי רעש במודל, ולכן קשה יותר לתוכנית הלמידה של המכונה לבודד ולזהות את האות האמיתי.
לכן אחת הדרכים הפשוטות ביותר להשוות הטיה ושונות היא להציע למהנדסים שלומדים במכונות לעבור קו דק בין יותר מדי הטיה או פשטנות יתר, לבין שונות או יותר מדי מורכבות.
דרך נוספת לייצג את הבאר הזו היא באמצעות תרשים בן ארבע רבעים המציג את כל השילובים של שונות גבוהה ונמוכה. ברבע הטיה נמוכה / שונות נמוכה, כל התוצאות נאספות יחד באשכול מדויק. בתוצאה גבוהה של הטיה / שונות נמוכה, כל התוצאות נאספות יחד באשכול לא מדויק. בתוצאה נמוכה / שונות גבוהה, התוצאות מפוזרות סביב נקודה מרכזית שתייצג אשכול מדויק, ואילו בתוצאה גבוהה של הטיה / שונות גבוהה, נקודות הנתונים הן מפוזרות והן אינן מדויקות באופן קולקטיבי.