בקרב סטארט-אפים טכנולוגיים, מדען הנתונים הוא מונח נפוץ יותר ויותר המשמש להתייחס לחנונים נתונים המסוגלים לגשר על פני אזורים פונקציונליים נפרדים של מודיעין נתונים. מדען נתונים הוא מי שנוח לבצע כמה היבטים של פרויקטים של מודיעין נתונים (אם לא כולם):
- רכישת נתונים: זה עשוי לכלול כתיבת מנתחים מותאמים אישית וסורקי אתרים או סקריפטים הממוקדים לשירותי אינטרנט או API ספציפיים למקורות נתונים לא מסורתיים.
- ניהול נתונים: ETL, לתפעל, לבצע שאילתות ותחזוקה של נתונים במאגרי נתונים, בחנויות עם ערכי מפתח או ב- Hadoop.
- הדמיית מידע: חשיפת דפוסים באמצעות ערכות כלים להדמיה סטטית ו / או פלטפורמות אינטראקטיביות המבוססות על פלאש, JavaScript או עיבוד.
- אנליטיקס: זה יכול לנוע בין טכניקות פשוטות למורכבות בסטטיסטיקה מרובת משתנים, למידת מכונות ו- NLP.
- תובנה: חילוץ, סיכום והצגת ממצאי מפתח בפני קהל רחב.
ישנם כלים, כישורים ופרטים טכניים רבים, ואפשר לבלות שנים בשליטה על כל אחד מהפריטים המפורטים לעיל. אמנם מדען נתונים לא יכול להחזיק בידע מומחה אמיתי באף אחד מהתחומים, אך נוח לו לדלג קדימה ואחורה ולבצע משימות בסיסיות בכולן. התוצאה היא חנון נתונים זריז מספיק כדי לחקור במהירות פרויקט נתונים ולהפיק תשובות לשאלות (ברמה גבוהה) מההנהלה. (על מדעני נתונים במדעני נתונים: כוכבי הרוק החדשים של עולם הטכנולוגיה.)
כדי לטפח מדעני נתונים, חברות צריכות להתמקד יותר בתרבות ובמבנה הארגוני. לעובדי נתונים רבים יש מספיק מיומנויות והכשרה בכדי להפוך במהירות לפרודוקטיבית בתחומים רבים של מודיעין נתונים. הבעיה היא שרובם לא עובדים בסביבות שמעודדות אותם להפוך למדעני נתונים. הם תקועים בממגורות ומוגבלים לתחום אחד או שניים של מודיעין נתונים. לעתים קרובות הם מוגבלים להשתמש בכלים ש"מאושרים "על ידי המנהלים שלהם.