ש:
מהם ארבע היסודות להיות מדען נתונים טוב?
ת:כפי שמציינים מומחים רבים, הפיכה למדענית נתונים מעולה דורשת שילוב של מיומנויות וניסיון שנבנה באמצעות למידה וניתוח ייעודי של תחום מורכב. מדעני נתונים כמנהלים ואוצרים של נכסי נתונים יקרי ערך הם ביקושים מאוד כיום. בואו נראה מה חלק מהכישורים היסודיים הללו.
הראשון מבין ארבעת המרכיבים הבסיסיים בעבודת מדעני נתונים הוא מתמטיקה וסטטיסטיקה. על מדעני נתונים טובים ללמוד להיות בקיאים במושגים מתמטיים שונים הקשורים בלימוד מכונות בפיקוח ולא מפוקח, כולל סוגי אלגוריתמים כמו עצי החלטה, יער אקראי, רגרסיה לוגיסטית, אשכולות ושימוש בממדיות בלימוד מכונות (ML). באופן כללי, עליהם להיות טובים להתמודד עם משוואות וסטטיסטיקות מתמטיות תוך שימוש במשאבי ניתוח סטטיסטי.
המרכיב הבסיסי העיקרי השני בעבודת מדעי הנתונים כולל תכנות וניהול בסיסי נתונים. אנשים צריכים להיות חזקים בשפות סקריפטים כמו פייתון ושפות סטטיסטיות כמו R, יחד עם ניסיון ומיומנות עם סמנטיקה וטכניקות תפעול של בסיס נתונים ו- SQL. הכרת רכיבי תוכנה כמו Hadoop, MapReduce, Hive ו- Pig מושכים גם הם את המעסיקים.
המרכיב היסודי השלישי בהפיכתו למדען נתונים טוב הוא המרכיב התיאורטי והפילוסופי בהבנת מדעי נתונים ולמידת מכונות. אנשים אלו צריכים להיות פותרי בעיות מתחילים בעצמם עם מחשבות סקרניות - אחרי הכל, הם משלבים ניתוח כמותי גולמי עם הבנה יצירתית של תהליכי למידת מכונות ומדעי נתונים. במקום להסתפק באנשי מספרים טכניים, עליהם להיות בעלי יסוד עמוק במה המשמעות היא ליצור פרויקטים של למידת מכונה ולעבוד על יוזמות מדעי נתונים מבחינת יעדי הסיום ותוצאות הסיום.
נדבך מרכזי רביעי בלמידה להיות מדעני נתונים טובים, כרוך בעבודה עם אנשים ויכולת להשתמש בנתונים בדרכים הגיוניות לאנשים אחרים.
מדעני נתונים טובים יכולים להיות מספרי סיפורים - הם יכולים לתרגם נתונים כמותיים לנרטיבים ותובנות. ככאלה, עליהם להיות בעלי כישורי תקשורת טובים כדי להיות מסוגלים להביא את עבודתם לשולחן ולהפיץ אותה למספר בעלי עניין או לקהל נתון ביעילות. אלה הם כמה מסוגי המיומנויות העיקריים שבונים מדען נתונים טוב שמוכן להשתתף בתעשיית ה- IT המהירה והמתקדמת במהירות.