תוכן עניינים:
הגדרה - מה המשמעות של נתונים ללא-תווית?
נתונים שאינם מסומנים הוא ייעוד לפיסות נתונים שלא תויגו בתוויות המזהות מאפיינים, מאפיינים או סיווגים. נתונים ללא-תווית משמשים בדרך כלל בצורות שונות של למידת מכונה.
Techopedia מסביר נתונים שאינם מסומנים
בסוגים של למידת מכונה הנקראת למידת מכונה ללא פיקוח, תוכנית למידת המכונה פועלת על ידי הערכת קבוצות של נתונים ללא תווית. מכיוון שלנתונים אין תוויות, על תוכנית הלמידה למכונה לזהות כל פיסת נתונים על תכונותיה ותכונותיה.
אחת הדרכים הטובות ביותר להסביר זאת היא באמצעות המטאפורה של קערת הפירות. נניח שתכנית למידת המכונה לומדת לזהות שלושה סוגים שונים של פירות - בננות, ענבים ותפוחים. אם הנתונים במערך ההדרכה הראשוני מסומנים, תוכנית לימוד המכונה עובדת מנקודת מבט זו - התאמת תמונות רצופות לאחת משלוש הקטגוריות.
עם זאת, אם אף אחת מחתיכות הנתונים אינה מסומנת בשלושת שמות הפירות - בננות, ענבים ותפוחים - תוכנית הלמידה של המכונה תצטרך לעבוד על ידי הערכת כל תמונה והסתכלות על מאפיינים כמו צבע - צהוב, אדום או סגול - צורות - ארוך ודק, עגול או מקובץ - ומאפיינים אחרים.
מדוגמא זו, קל לראות כיצד נתונים המסומנים מעניקים הזדמנויות הרבה יותר קלות להשתמש באלגוריתמים של למידת מכונה לתוצאות החלטות. עם זאת, תוכניות לימוד מכונות מתוחכמות ללא פיקוח העוסקות בנתונים ללא-תגיות יכולות להביא לתוצאות מדויקות ומדהימות להפליא.