בית שמע מדוע מספרים עצומים של קבצי תמונות חשובים לפרויקטים רבים של למידת מכונה?

מדוע מספרים עצומים של קבצי תמונות חשובים לפרויקטים רבים של למידת מכונה?

Anonim

ש:

מדוע מספרים עצומים של קבצי תמונות חשובים לפרויקטים רבים של למידת מכונה?

ת:

עבור חברות שמחפשות להסתבך בהשקעות הראשונות שלהן ללימוד מכונות (ML), כל התהליך יכול להיראות מעט קריפי ואזוטרי. עבור אנשים רבים, זה באמת קשה לדמיין כיצד למידת מכונה עובדת בפועל, ומה בדיוק הוא יעשה עבור עסק.

במקרים מסוימים, מישהו שחוקר למידת מכונות יכול להיות ממש אפיפאני כאשר הוא שוקל מדוע מספרים גדולים של קבצי תמונות שנאספים במכולות דיגיטליות מסודרות הם כה חשובים לפרויקטים של ML. הסיבה לכך היא שמושג "קובץ התמונה" עוזר לדמיין ML. המחשבה על זה מאפשרת לנו להבין יותר כיצד יישמרו סוגים אלה של טכנולוגיות על עולמנו בקרוב מאוד.

הורדה חינם: למידת מכונה ולמה זה חשוב

התשובה הקצרה היא שהמספרים הגדולים הללו של קבצי תמונות חשובים ללמידה של מכונה מכיוון שהם מייצגים מערכי הדרכה - סטים של נתונים ראשוניים שעל המחשב לעבוד עליהם תוך כדי למידה. אבל יש בזה קצת יותר מזה. מדוע תמונות כה יקרות?

אחת הסיבות לכך שהתמונות כה יקרות ערך היא שמדענים התקדמו רבות בעיבוד תמונות. אך מעבר לכך, הם התקדמו גם בסיוע מכונות לזהות תוצאות על סמך מה שבתמונה.

לדוגמה, כל מי ששמע על רשתות עיקשות עמוקות עם מנועים גנרטוריים ומפלים כאחד מבין מעט כיצד מחשבים יכולים לקרוא ולהבין נתונים ותמונות חזותיות. הם לא קוראים את הפיקסלים כמו פעם - הם למעשה "רואים" את התמונה ומזהים רכיבים. לדוגמה, חשוב על זיהוי הפנים של פייסבוק - המחשב לומד איך אתה נראה, ומזהה אותך בתמונות - כמו גם את הסובבים אותך. לעתים קרובות הדבר מתאפשר באמצעות צבירה של תמונות רבות והדרכה איטרטיבית המהווים בסיס לפרויקט למידת מכונה.

כאשר בעלי העניין זיהו תכנית ומושג, ויצאו ואספו את כל התמונות הרלוונטיות, והכניסו אותם לאלגוריתמים של למידת מכונה, הם יכולים למנף את הכוח העצום של בינה מלאכותית להפעלת תהליכים עסקיים.

חברה עשויה לשלוח סורק אינטרנט אל האינטרנט ומחפש תמונות שעשויות להכיל לקוח מסוים, כדי לבנות קובץ המראה את זהותו של הלקוח ואת העדפותיו ונטיותיו. החברה עשויה אפילו להשתמש במידע זה כדי להפוך אוטומטית לדואר ישיר או לשיווק ישיר אחר. כשאתה מתחיל לחשוב על זה ככה, קל לראות איך בדיוק אפשר לקשור את אותו תהליך של זיהוי תמונה וזיהוי לכל מיני פונקציונליות שתאפשר למחשבים לעשות כל כך הרבה מהדברים שבני אדם היו רגילים לעשות עבור כל ההיסטוריה המוקלטת שלנו. אם ניקח את הדוגמא של מחקר לקוחות, עם סוגי ההתקנות שלעיל, בני אדם אינם צריכים להיות מעורבים כלל: המחשב יכול "לצאת לאינטרנט" ולדווח בחזרה לבעליו או למחזיקי הנתונים.

עבור כל מי שעוסק בשכשוך במים העמוקים של למידת מכונות, הבנת הרעיון של כריית נתוני תמונות המוניות מספקת צעד ראשון טוב במפת דרכים לרתום את כוח הלמידה של המכונה ולבחון כיצד להשתמש בו לטובת מיזם.

מדוע מספרים עצומים של קבצי תמונות חשובים לפרויקטים רבים של למידת מכונה?