ש:
מדוע פרויקטים של למידת מכונה עשויים לדרוש מספר עצום של שחקנים?
ת:כשאתה חושב על למידת מכונות, אתה נוטה לחשוב על מדעני נתונים מיומנים העובדים על מקלדות בחדרי מחשבים. יש דגש קיצוני על ניתוח ואלגוריתמים כמותיים. לרבים מהתכניות הללו אין הרבה מאוד הקשר מיידי של העולם האמיתי - לפחות, זה מה שרבים היו חושבים.
עם זאת, חלק מתוכניות הלמידה המכונות הפורצות ביותר של ימינו עושות שימוש בצבאות אמיתיים של שחקנים אנושיים ברחוב, בחנויות ובכל מקום כדי שיוכלו לדגמן פעילויות אנושיות בסיסיות כמו הליכה, עבודה או קניות.
הורדה חינם: למידת מכונה ולמה זה חשוב |
מאמר Wired של טום סימונייט ממחיש זאת היטב עם הכותרת המתאימה "להפוך את AI לחכמה יותר, בני אדם מבצעים משימות מוזלות בעלות שכר נמוך."
בעזרת הדוגמה של סרטונים קצרים שצולמו במכולת Whole Foods, סימוניט מדגיש את סוגי העבודות שיעזרו לבנות חלק מהשלב הבא של למידת מכונה.
זה מוביל לשאלה מדוע כל האנשים האלה עוסקים בצילומי עצמם בסרטונים קצרים ופשוטים המתעדים פעולות כל כך מגוונות כמו הזזת זרוע או רגל.
התשובה שופכת קצת אור על היכן למידה במכונה ולאן היא הולכת.
"חוקרים ויזמים רוצים לראות את ה- AI מבין ופועל בעולם הפיזי", כותב סימונייט ומסביר מדוע הוא ואחרים מסתובבים עם מצלמות. ומכאן הצורך בעובדים להראות סצינות בסופרמרקטים ובבתים. הם מייצרים את חומר ההדרכה כדי ללמד אלגוריתמים על העולם והאנשים בו. "
כפי שמציינים מומחים רבים, כמה מהגבולות הגדולות ביותר של למידת מכונות כוללות עיבוד תמונה ועיבוד שפה טבעית. אלה נהלים כמותיים במיוחד - במילים אחרות, אין מגוון רחב של תשומות כמו שיש בסביבות "אמיתיות" בעולם האמיתי. במקום זאת, תוכניות למידת המכונה משתמשות בנתונים חזותיים ואודיו בדרכים מאוד ספציפיות לבניית מודלים. בעזרת עיבוד תמונות זה בחירת תכונות משדה ראיה (סופי). עבור NLP זה הרכבת פונטים.
מעבר לקטגוריות הקלט הספציפיות הללו כרוך במשהו שאפשר לקרוא לו "פער הדימוי והדיבור" - בהעברת דברים כמו עיבוד תמונה וזיהוי דיבור, אתה עובר לאזורים שבהם מחשבים צריכים להיות אנליטיים בדרכים שונות. מערכי האימונים יהיו שונים באופן מהותי.
היכנסו לצבא הסרטים. בחלק מפרויקטים חדשים אלה למידת מכונות, הרעיונות הקטנים ביותר לפעילות אנושית הם מערכות ההדרכה. במקום להיות מאומנים לחפש תכונות וקצוות ופיקסלים המתחברים למשימות סיווג, מחשבים משתמשים במקום זאת בסרטוני הדרכה כדי להעריך כיצד נראים סוגים שונים של פעולות.
דבר המפתח הוא מה המהנדסים יכולים לעשות עם נתונים אלה כאשר הם מצטברים וטעונים, וכאשר המחשב מאומן עליהם. בקרוב תוכלו לראות את התוצאות בתחומים שונים - למשל, הדבר יעשה את המעקב אפקטיבי ביותר. מחשבים יוכלו "לראות" בשדה הוויזואלי מה אנשים עושים, ולהחיל זאת על תחומים כמו שיווק ומכירות, או אולי, במקרים מסוימים, עבודה של סוכנות ממשלתית או משפט פלילי.
ההשלכות גם שמות מעט אור על הוויכוח בין שאלות מקסימום תועלת ושאלות פרטיות. חלק ניכר מהשימוש בסרטונים האלה יבנה מודלים של למידת מכונה העובדים למעקב - אבל מה עם אנשים שלא רוצים להיבדק? כאשר תוכניות לימוד מכונות חדשות אלה נפרסות במרחב הציבורי, מהן הזכויות של האדם והיכן נמשך הקו הזה?
בכל מקרה, חברות משתמשות במשאבי אנוש ווידאו מסוג זה בכדי לחפור באמת בסבבים מסוימים של התקדמות למידת מכונה ברמה הבאה, שיאפשרו למעשה למחשבים לזהות את המתרחש סביבם, ולא רק לסווג תמונות או לעבוד עם הפונמות של דיבור. זוהי התפתחות מעניינת מאוד ושנויה במחלוקת בתחום הבינה המלאכותית, וזו ראויה לחלק ממנה בתשומת לב בתקשורת הטכנולוגית ומחוצה לה.