בית שמע הטמע ניתוחים בכל מקום: מאפשר לאנשי מדען הנתונים

הטמע ניתוחים בכל מקום: מאפשר לאנשי מדען הנתונים

Anonim

על ידי צוות Techopedia, 25 באוגוסט 2016

ברק: המארחת רבקה יוז'ויאק דנה בתופעה של אנליסטים משובצים ומדעני נתונים אזרחיים עם ד"ר רובין בלור, דז בלנשפילד ודויד סוונור.

עליך להירשם לאירוע זה כדי לצפות בסרטון הווידאו. הירשמו לצפייה בסרטון.

רבקה יוז'ויאק: גבירותיי ורבותיי, שלום וברוכים הבאים להוט טכנולוגיות. "הטמעה בכל מקום: הפעלת מדען נתוני האזרח" הוא הנושא שלנו היום. אני ממלא את המארח הרגיל שלך, זו רבקה יוז'ויאק ממלאת את אריק קוואנה. כן, השנה חמה. במיוחד המונח "מדען נתונים" זכה לתשומת לב רבה למרות שהיינו קוראים להם שמות משעממים כמו "סטטיסטיקאי" או "מומחה לניתוח", די מתמודד עם אותו סוג של פעילויות אבל יש לזה שם חדש וסקסי וזה אוסף הרבה תשומת לב. רצוי מאוד שיהיה במקום העבודה, מועיל לארגון, וכולם רוצים כזה. אבל הם: 1) יקר, 2) קשה למצוא. אתה יודע, זה היה בכל החדשות על מחסור במיומנות של מדעני נתונים, כן, אבל עדיין הם מציעים ערך אדיר לארגון ואנשים סוגרים דיבורים כדי להבין איך להשיג את הערך הזה מבלי שיצטרכו להפיל את הפרוטה, אז לדבר.

אבל החדשות הטובות הן שאנחנו רואים כלים ותוכנה שיוצאים שהם סוג של פיצוי על המחסור הזה. יש לנו אוטומציה, למידת מכונות, ניתוחים משובצים, וזה מה שנלמד עליו היום וזה סוג של עלייה למונח חדש זה, "מדען נתוני האזרח", ומה זה אומר? לא, זה לא מדען הנתונים המיומן שלך, זה יכול להיות המשתמש העסקי שלך, מומחה ה- BI שלך, מישהו מ- IT, מישהו שיש לו רקע אבל אולי לא בהכרח המומחיות. אבל מה שהיא עושה, הכלים והתוכנה, היא שהיא נותנת לאנשים רבים יותר גישה לפתרונות החכמים הללו למרות שהם אולי לא מכירים את הקידוד העמוק. אבל זה רק עוזר בשיפור הביצועים בסך הכל כשאתה נותן לכולם גישה קצת יותר למחשבה האנליטית ההיא. אתה לא צריך לקבל את ההכשרה בהכרח כדי לקבל את סוג הסקרנות שיכול להוביל לתובנות טובות עבור החברה שלך.

דיון כי איתנו היום הוא רובין בלור משלנו, אנליסט ראשי מקבוצת בלור, אחד מדעני הנתונים החמקמקים עצמו, דז בלנשפילד שקורא, ואז יש לנו דיוויד סוונור מדל סטטיסטיקה יעביר לנו היום מצגת. ועם זה אני אעביר את זה לרובין בלור.

רובין בור: אוקיי, תודה על ההקדמה הזו. חשבתי על זה בהקשר היסטורי. מה שאנחנו בעצם בוחנים כאן הוא אחד העיצובים של לאונרדו דה וינצ'י למעין דאון שאדם יכול להניח על גבו. אין לי מושג אם זה אכן יצליח. לא הייתי נכנס לזה, אני חייב לומר. עם זאת, דה וינצ'י, בכל פעם שאני חושב על דה וינצ'י, אני חושב עליו כאחד האנשים הסקרנים והאנליטיים ביותר שאי פעם היה קיים. וזה די ברור אם רק מסתכלים על הדאון הזה שהוא מתוכנן על בסיס כנף של ציפור והוא בדק בצורה זו או אחרת את טיסות הציפורים כדי לבנות אותה.

אם ניקח את הפרספקטיבה ההיסטורית - למעשה חיפשתי זאת - אנליטיקה היא אולי היישום העתיק ביותר של המתמטיקה. ישנם מפקדים המתוארכים לפחות בתקופת בבל. אנו יודעים על זה מכיוון שבעצם יש כמה טבליות חרצית שיש עליהם נתונים כאלה. לא ידוע אם היה משהו שחזר קודם לכן. אבל הדבר הברור הוא שיש לך לעצמך תרבות עם אוכלוסייה גדולה של אנשים, זה בעצם דורש תכנון וכדאי לדעת למה אתה מתכנן ומה הדרישות של אותם אנשים בפועל.

וזה סוג של איפה זה התחיל וזה גם המקום בו המחשוב החל מכיוון שהמחשבים המוקדמים, המחשבים המכניים המוקדמים, היו למעשה, אני חושב שהראשון היה המפקד שיצרה הולרית, שהפכה ליבמ, אני מאמין. כל זה התקדם. הייתה איזושהי הפוגה בין אולי שנות השבעים ועד ימינו, שם יש מספר עצום של יישומים ואנליטיקה אחרים, אפשר לומר, תפס מקום מושב אחורי. כן, היו אנליטיקס - זה קרה בארגונים גדולים, בעיקר בנקים וחברות ביטוח, ולמעשה ג'נרל אלקטריק וטלקו ודברים כאלה - אבל זה לא היה בשימוש בדרך כלל במהלך העסקים וכעת זה מתחיל להתרגל באופן כללי לאורך כל הדרך עסק. וזה שינה את המשחק, באמת. הדבר הראשון שחשבתי שאשים אליו תשומת לב הוא פירמידת הנתונים שאני אוהבת במיוחד. זהו, כוונתי, שציירתי את אחד מאותם 20 שנה - לפחות לפני 20 שנה - לנסות ולהבין, באמת, באותה תקופה, ניסיתי להבין את ה- BI וכמה מכריית הנתונים המוקדמת שנעשתה. מה שהגדרתי כאן הוא רעיון הנתונים והדוגמאות לכך הן אותות, מדידות, הקלטות, אירועים, עסקאות, חישובים, אגרגציות, נקודות מידע אינדיבידואליות. אתה עלול לחשוב עליהם כמולקולות של מידע, אבל אלה נקודות בודדות. זה הופך למידע ברגע שהוא מקבל הקשר. נתונים מקושרים, נתונים מובנים, מסדי נתונים, ויזואליזציה של נתונים, פלוטרים, סכמרים ואונטולוגיות - כולם מתאימים לדעתי כמידע מכיוון שמה שעשית זה לצבור מגוון רב ביחד ויצר משהו הרבה יותר מנקודת נתונים, משהו שלמעשה יש לו צורה, צורה מתמטית.

מעל זה יש לנו ידע. אנו יכולים, על ידי בחינת מידע, ללמוד כי ישנם דפוסים שונים ואנחנו יכולים למנף דפוסים אלה על ידי ניסוח של כללים, מדיניות, הנחיות, נהלים, ואז זה מקבל צורה של ידע. ודי כמעט כל תוכנות המחשבים, כל מה שהם עושים, הם ידע מסוג זה, מכיוון שהם עובדים נגד נתונים ומיישמים עליהם כללים. יש לנו את שלוש השכבות הללו וישנו חידוד הולך וגובר שמתרחש בין השכבות. ובצד שמאל של התרשים הזה מוצגים לך נתונים חדשים שנכנסים, כך שהרבה מהדברים האלה הם סטטיים. הנתונים מצטברים, המידע מצטבר והידע עשוי לצמוח. בחלקו העליון, יש לנו "הבנה" והייתי טוען, למרות שמדובר בטיעון פילוסופי, שההבנה שוכנת רק בבני אדם. אם אני טועה בעניין הזה, כולנו יוחלפו על ידי מחשבים בשלב מסוים בזמן. אבל במקום לערוך את הדיון, אני אמשיך לשקופית הבאה.

כשהסתכלתי על זה, הדבר המעניין, זה משהו אחרון, הדבר המעניין היה לנסות להבין מה זה בעצם ניתוחים. ובסופו של דבר על ידי ציור דיאגרמות שונות ובסופו של דבר שנראה כך, הגעתי למסקנה, למעשה, פיתוח אנליטי הוא באמת רק פיתוח תוכנה עם כמות נורמלית של נוסחאות מתמטיות. חקר אנליטי שונה במקצת מפיתוח תוכנה במובן זה שלמעשה הייתם לוקחים דגמים רבים ושונים וחוקרים אותם על מנת לייצר ידע חדש אודות נתונים. אבל ברגע שיצרתם, הוא מיושם גם במה שאני חושב עליו כתמיכה בהחלטה פסיבית, שהיא מידע שנמאס רק למשתמש; תמיכה בהחלטה אינטראקטיבית, שהיא דברים כמו OLAP, שם מקבלים למשתמש מערך נתונים מובנה בו הם יכולים לחקור ולהסיק דברים לעצמם בעזרת הכלים השונים הקיימים. הדמיה רבה זה ככה. ואז יש לנו אוטומציה אם אתה יכול פשוט להפוך תובנה אנליטית שאספת לקבוצת כללים שניתן ליישם, אינך צריך בהכרח בן אנוש כדי להיות מעורב. ככה הסתכלתי על זה כשעשיתי את כל זה. ודברים שונים התחילו להעלות על דעתי. לאחר תחום פעילות, נגיד, ברגע שמכוש תחום של נתונים, ממוקש ביסודיות, נחקר ביסודיות מכל כיוון אפשרי, בסופו של דבר הוא פשוט נהפך ל- BI מגובש. הידע שהומצא מתחיל להיות ידע שמודיע למשתמשים שונים בדרכים שונות ומגדיל את היכולת שלהם, בתקווה, למעשה לבצע את העבודה שהם מבצעים.

אחד הדברים ששמתי לב אליהם והסתכלתי על ניתוחים חזויים במשך כחמש שנים, אבל ניתוחים חזויים הופכים ל- BI, במובן זה שזה פשוט הופך למידע שימושי להזנה לאנשים וכפי שכבר ציינתי, יש דיווחי BI אוטומטיים, בירור BI, BI, דרגות שונות מאוד שלו וניתוח חזוי הולך למעשה בכל שלושת הכיוונים. והתהליך האנליטי כפי שציינתי אינו שונה מפיתוח תוכנה, אלא רק על ידי אנשים שונים עם כישורים מעט שונים. אני מניח שעלי להדגיש שהכישורים הנדרשים בכדי לגרום למדען נתונים טוב באמת לקחת שנים עד שרכש. הם לא נרכשים בקלות ולא הרבה אנשים יכולים לעשות את זה, אבל זה מכיוון שהיא כרוכה בהבנת המתמטיקה ברמה מאוד מתוחכמת כדי לדעת מה תקף ומה לא תקף. פיתוחים של אנליטיקס, גילוי ידע חדש, השתלת אנליטיות, מדובר על הפעלת הידע למבצעי. זה סוג התפאורה שאני רואה לכלל האנליטיקס. זה אזור ענק ויש בו המון המון המון המון, אבל אני חושב שההכללה חלה על הכל.

ואז יש את השיבוש העסקי, כפי שציינתי שיש מספר ארגונים, חברות התרופות היא עוד אחת, שיש להם ב- DNA שלהם אנליטיות. אבל ישנם ארגונים רבים שבאמת אין להם את ה- DNA שלהם, ועכשיו יש להם את היכולת, עכשיו התוכנה והחומרה הם הרבה יותר זולים מבעבר, עכשיו יש להם את היכולת לנצל אותה. הייתי אומר מספר דברים. הדבר הראשון הוא שהאנליטיקה היא, במקרים רבים מדובר במו"פ. יתכן שאתה פשוט מיישם ניתוחים לאזור ספציפי בארגון ויכול להיות שנראה שאתה שגרתי בדרך זו או אחרת מנתח את הזמנות הלקוחות מנקודות מבט שונות ומצטרף אותו לנתונים אחרים. אבל אנליטיקה למעשה יוצרת אפשרות להסתכל על הארגון בכללותו ולנתח די פעילויות כלשהן שמתרחשות בתוך הארגון ושרשראות שלמות של פעילויות. אבל ברגע שתעבור למעשה לאזור זה, הייתי טוענת שמדובר במחקר ופיתוח. ויש שאלה שנשאלתי כמה פעמים, והיא: "כמה צריכה חברה להוציא על ניתוח?" ואני חושב שהדרך הטובה ביותר לחשוב על מתן תשובה לכך היא לחשוב על אנליטיקס כמחקר ופיתוח., ופשוט תשאלו, "ובכן כמה הייתם מוציאים על מו"פ בתחום היעילות של העסק?"

והעסקים שאינם בתחום האנליטיקס, יש המון דברים שהם לא יודעים. ראשית, הם לא יודעים לעשות זאת. בדרך כלל אם הם בעצם הולכים בדרך זו או אחרת לאמץ אנליטיקס בארגון - הם די באמת אין ברירה אלא לפנות לייעוץ שיכול לעזור להם לעשות זאת מכיוון, זה יהיה בלתי אפשרי או באמת קשה מאוד עבור רוב לעסקים להעסיק מדען נתונים, למצוא אחד, לשלם עבור אחד ולמעשה לסמוך עליהם שיעשו מה שאתה רוצה שיעשו. מאוד מסובך. מרבית העסקים אינם יודעים כיצד להעסיק או לחנך צוות שיעשה את העבודה הזו בפועל, והסיבה לכך היא פשוט שהיא עדיין לא נמצאת ב- DNA שלהם, ולכן זה לא חלק מהתהליכים העסקיים הטבעיים שלהם. זה מזין לנקודה הבאה. הם לא יודעים איך להפוך את זה לתהליך עסקי. הדרך הטובה ביותר לעשות זאת, דרך אגב, היא להעתיק את מה שחברות התרופות וחברות הביטוח, פשוט תראו, וחלק מהחברות במרכז הבריאות, פשוט תראו את הדרך שבה הם משתמשים באנליטיקה והעתקה. כי זה תהליך עסקי. לא יודע כיצד לבצע משטרה או לבקר אותה. זה באמת, במיוחד עכשיו שהרבה מאוד חברות תוכנה יצרו מוצרים שמבצעים אוטומציה של ניתוחים רבים. הנקודה בנושא ביקורת חשובה, כאשר יש לך ייעוץ או מישהו באתר שאפשר לסמוך עליו שיבין מה התוצאות של חישוב אנליטי כלשהו, ​​זו סוג של בחירה שעליך לעשות, אבל אם אתה מכניס כלים אנליטיים באמת חזקים בידי אנשים שלא מבינים כמו שצריך ניתוחים, סביר להניח שהם יקפצו למסקנות שאולי אינן נכונות. וכאמור, חברות לא יודעות לתקצב את זה.

אלה טעמים של אנליטיקה, אני פשוט אעבור בהם. ניתוחים סטטיסטיים ומודלים סטטיסטיים שונים באופן משמעותי מניתוח חזוי, שרובם אגב הולם עקומות. למידת מכונה שונה מאותם דברים, ניתוח נתיבים וסדרות זמן, אשר בעצם נעשית על זרמי סטטוס שוב שונים. ניתוח גרפים שונה שוב, וניתוח טקסטים ואנליטיקה סמנטית שוב שונים. זה רק מציין שזה דבר מאוד רב-ז'אנרי. זה לא, אתה לא מתחיל לעשות ניתוחים, אתה מתחיל להסתכל על בעיות שיש לך ומחפש את הכלים השונים וטעמים שונים של ניתוחים שיתאימו לאלו. ולבסוף, הרשת נטו. בגלל התפתחות חומרה ותוכנה, לדעתי אנליטיקה נמצאת בחיתוליה. יש עוד הרבה והרבה עוד לבוא ונראה שזה יתפתח בשנים הבאות. אני חושב שאני יכול להעביר את הכדור לדצ עכשיו.

דז בלנשפילד: כן, דברו על מעשה קשה שעוקב אחריו, רובין. אני הולך לבקר בנושא זה בקצרה מאחת הזוויות האהובות עלי, שהיא זווית האדם. כל כך הרבה שינויים מתרחשים בחיי היומיום שלנו. אחת השיבושים הגדולים ביותר בחיי היום יום שלנו, כרגע בעיניי, היא פשוט עבודה יומיומית. לפנות לעבודה ולנסות לבצע את העבודה שכרעתם לבצע, והציפייה הגוברת שאתם הולכים לעבור מאדם יומיומי לגיבור-על וכמות המידע שזורמת בארגונים ופולטת מאוד מאוד מהר, זה אתגר משמעותי ויותר ויותר אנחנו צריכים לספק לאנשים כלים טובים וטובים יותר לנסות ולהתמודד עם זרימת ידע ומידע ולכן חשבתי שאנסה לבוא עם זה מזווית קצת מהנה . אבל, זה תמיד מכה אותי איך יש לנו המוני המוח או הבזק הגבוהים האלה וכדומה, שהם סוגים אותנו כמובילים אותנו אל מה שאנחנו מדברים עליו כניתוח אבל באמת מה שאנחנו מדברים עליו הוא להנגיש מידע לאנשים, מה שמאפשר להם לקיים אינטראקציה עם זה ולעשות זאת באופן שהוא טבעי וזה מרגיש נורמלי.

ולמעשה, זה מזכיר לי סרטון יוטיוב של ילד קטן, תינוק קטן, יושב על הרצפה והוא יושב שם משחק עם אייפד והוא מתנופף וצובט ומוחץ ומוציא את התמונות ומשחק עם המסך, הנתונים שם. ואז ההורה מוריד את האייפד ומניח מגזין, מגזין מודפס על ברכיו של הילד. וכנראה שהילד הזה לא בן יותר משנתיים. הילד מתחיל לנסות ולהחליק עם מסך המגזין, וצובט וסוחט והמגזין לא מגיב. הילד מרים את האצבע כלפי מעלה ומביט בו וחושב, "הממ, אני לא חושב שהאצבע שלי עובדת", וזה מנקר את עצמו בזרוע וחושב, "אה לא, האצבע שלי עובדת אני יכול להרגיש את הזרוע שלי וזה נראה טוב ", וזה מתפתל באצבע, והאצבע מתפתלת ומגיבה. כן. ואז הוא מנסה שוב לתקשר עם המגזין, ונמוך והנה הוא לא צובט ולוחץ ומגלול. ואז הם מורידים את המגזין ומחזירים את האייפד לחיקו, ופתאום הדבר עובד. וכך הנה תינוק שהגיע והוכשר להשתמש בכלי אנליטי או בכלי סטרימינג בשידור חי לבידור והוא לא יכול להבין איך מגזין צריך לעבוד ואיך לדפדף בדפים.

וזה מושג מעניין בפני עצמו. אבל כשאני חושב על ידע שמסתובב בארגונים, ועל האופן שבו נתונים זורמים ועל אופן התנהגותם של אנשים, אני חושב לעתים קרובות על התפיסה הזו של מה שאנשים למדו להיות אספסוף פלאש, שהוא אירוע שבו, ואשר המדיה החברתית עושה זה אפילו יותר קל לעשות זאת, רעיון שכזה שמגיע למקום הזה בזמן ובמועד ובזמן זה, או וידאו ולמד את הריקודים האלה, או חבוש את הכובע הצבעוני הזה ומצביע צפונה בשעה אחת. ואתה דוחף את זה דרך הרשת שלך, ובאופן בלתי נמנע עומס שלם של אנשים, מאות מהם, מופיעים באותו מקום בו זמנית עושים את אותו הדבר ויש את גורם הוואו הזה, כמו "פרה קדושה, זה היה באמת מרשים! "אבל למעשה זה רעיון פשוט מאוד, וקונספט פשוט שרק נדחף החוצה דרך הרשתות שלנו ואנחנו מקבלים את התוצאה הזו שהיא דבר מדהים מבחינה חזותית ומרשים במיוחד. וכשאתה חושב על ארגון, הדרך בה אנו רוצים שאנשים יתנהגו והדרך בה אנו רוצים שהם יתמודדו עם מערכות מידע ולקוחות, זה בדרך כלל כל כך פשוט, זה רעיון או מושג או תכונה תרבותית או התנהגותית שאנחנו מנסים להעביר לעבור ולהעצים בעזרת כלים ומידע.

ועומד בבסיס כל המנטרה הזו שהייתה לי במשך למעלה משני עשורים וחצי, כלומר אם הצוות שלך לא יכול למצוא את מה שהם צריכים כדי לעשות את העבודה שלהם, יהיה זה כלים או מידע, תמיד הם ימציאו את הגלגל מחדש. וכך זהו אתגר הולך וגובר כעת, איפה שיש לנו המון ידע והרבה מידע ודברים שנעים מהר מאוד, שאנחנו רוצים להפסיק לאנשים להמציא את הגלגל מחדש. וכשאנחנו חושבים על סביבת העבודה שלנו, וחוזרים לזווית האנשים, שהיא אחת המועדפות עלי, נדהמתי כשהופתענו שהחדרונים לא היו סביבה תורמת לתוצאות טובות, או שאנחנו מסדרים דברים כמו זה מחריד תמונות כאן, וזה לא השתנה הרבה, פשוט הוריד את הקירות וקרא להם מרחבי עבודה פתוחים. אבל באמצע עם הלולאה הצהובה סביבם, ישנם שני אנשים שמחליפים ידע. ובכל זאת, אם אתה מסתכל על שאר החדר, כולם יושבים שם בצניעות מתחבקים שם ומכניסים מידע למסך. ולא פעם לא ממש מחליפים ידע ונתונים, ויש לכך מגוון סיבות. אבל האינטראקציה באמצע הרצפה משמאל שם במעגל הצהוב, יש שם שני אנשים מפטפטים שם, מחליפים ידע, וכנראה שמנסים למצוא משהו, מנסים לומר, "אתה יודע איפה הדוח הזה, איפה אני אני יכול למצוא את הנתונים האלה, באיזה כלי אני משתמש בכדי לעשות את הדבר הזה? "וכנראה שזה לא עבד אז אין להם כלום, והסתובבו על הרצפה, הפרו את הכלל של שטח המשרד בתא ועשו זאת באופן אישי.

והיו לנו סביבות דומות ברחבי המשרד שאנחנו מצחיקים בהן בבדיחות לב, אבל המציאות היא שהן די חזקות ויעילות. ואחד המועדפים עלי הוא פלטפורמת האנליטיקס הניידת או הקבועה המכונה מקרר המים, שאנשים קמים שם ומפטפטים שם בצ'אט ומחליפים ידע, ומשווים רעיונות ומבצעים ניתוחים בזמן שהם עומדים ליד מצנן המים ומחליפים רעיונות. הם מושגים חזקים מאוד כשחושבים עליהם. ואם אתה יכול לתרגם אותם למערכות וכלים שלך, אתה מקבל תוצאה מדהימה. ויש לנו את המועדף על כל הזמנים, שהוא בעצם מוקד הפצת הנתונים החזק ביותר של המשרד, המכונה גם דלפק הקבלה. ואם אתה לא מצליח למצוא משהו, לאן אתה הולך? ובכן אתה הולך לחזית המשרד והולך לקבלה ואומר, "אתה יודע איפה x, y, z?", ואני מעז מישהו לומר לי שהם לא עשו זאת לפחות פעם אחת בחדש עבודה או בנקודת זמן מסוימת שבה הם פשוט לא מצליחים למצוא משהו. ואתה צריך לשאול את עצמך, מדוע זה המקרה? זה צריך להיות איפשהו באינטראנט או בכלי כלשהו או כל דבר אחר. זה אמור להיות קל למצוא.

וכך בכל מה שקשור לנתונים ואנליטיקה והכלים שסיפקנו לצוות שלנו לבצע את עבודתם והדרך בה בני אדם מתקשרים עם משרות, יש לי את התפיסה שלפני הופעתם האחרונה של כלי ניתוח ופלטפורמות נתונים גדולים, או "עיבוד נתונים", כמו גם קוראים לזה בבית הספר הישן, הדיווח ושיתוף הידע היו רחוקים מלהיות דינאמיים או שיתופיים או פתוחים, וכשחושבים על סוג המערכות שאנו מצפים שאנשים יעשו את עבודתם היה לנו קלאסי, מה אנשים מכנים עכשיו מורשת, אבל המציאות היא שרק מורשת היא שקיימת והיא עדיין כאן היום, ולכן היא לא באמת מורשת. אך מערכות משאבי אנוש מסורתיות ומערכות ERP - ניהול משאבי אנוש, תכנון משאבים ארגוניים, ניהול נתונים ארגוניים ומערכות בהן אנו משתמשים כדי לנהל את המידע לניהול חברה. זה תמיד מושתק. ומהקצה העליון, פלטפורמות פשוטות כמו אינטראנט מחלקתי, מנסות לתקשר איפה הדברים נמצאים ואיך להשיג אותם ואיך לתקשר עם הידע שמסביב. אנו קופצים את זה באינטראנט שלנו. זה טוב באותה מידה כמו האנשים שעושים זמן ומאמץ לשים את זה שם, אחרת זה פשוט נשאר בראש שלך. או שיש לך נתונים שיושבים עד הסוף בתחתית שרשרת המזון, במשרדי מנהל עסקים ארגוניים וכל מה שביניהם, כך שרשתות האחסון שלה מלאות בקבצים ונתונים, אבל מי יודע איפה למצוא אותם.

לרוב, לא בנינו פלטפורמות נתונים סגורות או מערכות סגורות, ולכן אנשים חזרו כמו גיליונות אלקטרוניים ו- PowerPoints כדי להעביר מידע במקום. אבל היה לי משהו מעניין שהתרחש לאחרונה, בעיניי, וזה שהמכשירים הניידים והאינטרנט בכלל עובדים כך שהדברים יכולים להיות טובים יותר. ובעיקר במרחב הצרכני. וזה דבר מעניין שבחיי היומיום התחלנו להיות דברים כמו בנקאות באינטרנט. לא היינו צריכים ללכת פיזית לבנק כדי לתקשר איתם, יכולנו לעשות זאת בטלפון. במקור זה היה מגושם אבל אז האינטרנט הגיע והיה לנו אתר. אתה יודע, וכמה פעמים ביקרת בפועל בבנק שלך בזמן האחרון? למעשה אני לא יכול, ניהלתי שיחה על זה שלשום, ולמעשה אני לא זוכר את הפעם האחרונה שהלכתי לבנק שלי, שהייתי בהלם ממנה, חשבתי שאני חייב להיות מסוגל לזכור את זה, אבל זה היה כל כך ארוך לפני שאני בעצם לא זוכר מתי נסעתי לשם. וכך יש לנו כעת את הגאדג'טים האלה בצורה של מוביילים וטלפונים, טאבלטים ומחשבים ניידים, יש לנו רשתות וגישה לכלים ומערכות, ואת מרחב הצרכנים שלמדנו שדברים יכולים להיות טובים יותר, אבל בגלל של השינוי המהיר במרחב הצרכני שחל שינוי יותר רדום וקרחוני בארגונים ובסביבות, לא תמיד לקחנו את השינוי הזה לחיי העבודה היומיומיים.

ואני אוהבת לחטט כי אתה לא יכול להזרים נתונים ל hardcopy. בתמונה הזו כאן יש אדם שיושב ומסתכל בכמה ניתוחים שבוצעו, ויש גרף יפהפה שהופק על ידי מישהו שכנראה משלמים לו הרבה כסף כסטטיסטיקאי או כאקטואר, והם יושבים שם ומנסים לעשות אנליטיקות על גבי קשיח ובוחנות אותו. אבל הנה הדבר המפחיד עבורי: האנשים האלה בחדר הישיבות הזה, למשל, ואני אשתמש בזה כדוגמה, הם מקיימים אינטראקציה עם נתונים שעכשיו הם היסטוריים. וזה ישן ממש מאז שהדבר הזה הופק ואז נדפס, אז אולי זה דו"ח בן שבוע. עכשיו הם מקבלים החלטות על נתונים לא כל כך טובים אלא על נתונים ישנים, אשר תמיד יכולים להיות נתונים רעים. הם מקבלים היום החלטה על סמך משהו שהוא היסטורי, וזה מקום רע מאוד להיות בו. הצלחנו להחליף את ההעתק הזה כמו טבליות וטלפונים מכיוון שהסתדרנו מהר מאוד במרחב הצרכני, וכעת עבדנו את זה במרחב הארגוני, שזמן אמיתי הוא תובנות זה ערך בזמן אמת.

ואנחנו הולכים ומשתפרים בזה. וזה מביא אותי לנקודה שרובין העלה קודם לכן, זה היה הרעיון של מדען הנתונים של האזרח והדחף של המושג הזה. מבחינתי, מדען נתונים לאזרח הם פשוט אנשים רגילים עם הכלים והמידע הנכונים כמו האייפד. הם לא צריכים לעשות את המתמטיקה, הם לא צריכים לדעת את האלגוריתמים, הם לא צריכים לדעת ליישם את האלגוריתמים ונתוני הכללים, הם רק צריכים לדעת להשתמש בממשק. וזה מחזיר אותי אל ההיכרות שלי עם הרעיון של הפעוט היושב שם עם אייפד לעומת מגזין, לעומת אייפד. הפעוט יכול ללמוד במהירות רבה, באופן אינטואיטיבי, כיצד להשתמש בממשק של אייפד כדי לצלול למידע ולתקשר איתו, אם כי אולי משחק או מדיה זורמת או וידאו. אבל זה לא יכול היה לקבל את אותה התגובה או האינטראקציה מאותו סרגל מגזינים ופשוט מהבהב עמוד אחר דף, וזה לא מרתק במיוחד, במיוחד אם אתה פעוט שגדל עם אייפד. באופן בלתי הפיך, בני אדם יכולים להסתכל וללמוד מהר מאוד כיצד לנהוג בכלים ודברים שאם רק נספק להם, ואם נספק להם ממשק כמו מכשירים ניידים ובעיקר טאבלטים וסמארטפונים עם מסכים גדולים מספיק, ובמיוחד אם תוכלו ליצור אינטראקציה אותם במגע, בתנועות אצבעות, פתאום אתה מקבל מושג זה של מדען נתונים אזרחיים.

מישהו שיכול ליישם מדעי נתונים בכלים הנכונים, אך מבלי שיצטרך לדעת כיצד לעשות זאת. ובעיניי הרבה מכל זה, כמו שאמרתי, מונע על ידי השפעה צרכנית, שזזה והפכה לביקוש ומיזם. כמה דוגמאות ממש מהירות. אנו, רבים מאיתנו, היינו מתחילים לעשות דברים עם הבלוגים והאתרים שלנו, כמו להכניס מודעות קטנות או להסתכל על מעקב ותנועה, השתמשנו בכלים כמו גוגל אנליטיקס והוקפנו לעובדה שבבלוגים שלנו ובאתרים הקטנים שלנו, נוכל להכניס שם קטעי קוד קטנים וגוגל הייתה נותנת לנו תובנות בזמן אמת לגבי מי מבקר באתר, מתי ואיפה ואיך. ובזמן אמת יכולנו לראות אנשים פוגעים באתר, עוברים על הדפים ואז נעלמים. וזה היה די מדהים. אני עדיין אוהב לעשות את זה, כשאני מנסה להסביר ניתוחים בזמן אמת לאנשים, אני מטומטם רק כדי להראות להם אתר עם גוגל אנליטיקס מחובר, ולמעשה רואה את האינטראקציה החיה עם אנשים הפוגעים באתרים ושואל אותם, "דמיין אם היו לך תובנות מסוג זה בזמן אמת. "

קח דוגמה קמעונאית, ואולי תרופות, אני חושב שאתה קורא לזה חנות תרופות באמריקה, בית מרקחת שבו אתה נכנס וקונה הכל, החל בטבליות כאב ראש ועד קרם שמש וכובעים. ניסיון לנהל את הארגון ללא מידע בזמן אמת הוא מושג מפחיד כעת אנו יודעים מה אנו יודעים. לדוגמה, אתה יכול למדוד תנועה ברגליים, אתה יכול להציב מכשירים ברחבי החנות עם פרצוף סמיילי בצד אחד של המסך מכיוון שאתה שמח, ואדום אומלל מצד ימין וקצת גוונים שונים באמצע. ויש בימינו פלטפורמה שנקראת "שמח או לא", בה אתה נכנס לחנות ואתה יכול לדפוק פרצוף שמח או פנים עצובות, תלוי במשוב חיובי של לקוחותיך. וזה יכול להיות אינטראקטיבי עם זמן אמת. אתה יכול לקבל תמחור מונע ביקוש בשידור חי. אם יש הרבה אנשים שם, אתה יכול להעלות את המחירים מעט, ואתה יכול לעשות זמינות במלאי ולספר לאנשים, למשל - חברות תעופה, למשל, יגידו לאנשים כמה מקומות יש זמינים כעת באתר כאשר אתה אתה מזמין טיסה, אתה לא רק מחייג באופן אקראי ומקווה שתוכל להופיע ולקבל טיסה. מידע חי בשידור חי, אתה יכול לדעת מתי אנשים פועלים לכיבוי וכיבוי. רכש, אם אתה נמצא ברכישה ויש לך נתונים חיים, אתה יכול לעשות דברים כמו לחכות שעה ולגדר מפני מחיר הדולר האמריקני כדי לקנות את העומס הבא שלך במלאי ולהציץ מטען של דברים.

כשאני מראה לאנשים גוגל אנליטיקס ואני מעביר סוג כזה של אנקדוטה, רגע האיראקה הזה, הרגע הזה "אה!", הנורה הזו הולכת במוחם כמו, "הממ, אני יכול לראות המון מקומות שבהם יכולתי לעשות את זה . אם רק היו לי הכלים ולו רק הייתה לי גישה לידע הזה. "ואנחנו רואים זאת כעת במדיה החברתית. כל מי שמשתמש במדיה חברתית מנוסה מלבד הצגת תמונות של ארוחת הבוקר שלהם, נוטה לבדוק כמה לייקים הם מקבלים וכמה תנועה הם מקבלים וכמה חברים הם מקבלים, והם עושים זאת עם אוהב, למשל, טוויטר ככלי ניתוח. אתה יכול לפנות אל Twitter.com כדי להשתמש בכלי, אך אתה מקליד ל- Google Twitter Analytics dot com, או לחץ על הכפתור השמאלי למעלה ומוריד את התפריט ועושה את זה, אתה מקבל גרפים יפים וחיים אלה המספרים לך כמה ציוצים שאתה עושה בעצמך וכמה אינטראקציות איתם. וניתוח בזמן אמת רק במדיה החברתית האישית שלך. תאר לעצמך שאם היו לנו דמויות של גוגל אנליטיקס ופייסבוק ולינקדאין וטוויטר, סטטיסטיקות eBay יבואו אליך, אך בסביבת העבודה שלך.

עכשיו יש לנו סוג חי של אינטרנט ונייד בהישג ידנו, זה הופך למושג כוח. וכך זה מסיק אותי למסקנה, וזה שלא תמיד מצאתי שארגונים שממנפים כלים וטכנולוגיה מוקדם הם משיגים יתרון כה משמעותי על פני המתחרים שלהם, עד שלמעשה המתחרים אף פעם לא יתפסו. ואנחנו רואים את זה עכשיו עם הקונפליקט של מדען נתונים אזרחיים. אם נוכל לקחת אנשים עם הכישורים, הידע ששכרנו עבורם, ונוכל לתת להם את הכלים הנכונים, במיוחד היכולת לראות את הנתונים בזמן אמת ולגלות נתונים ולדעת היכן הם נמצאים בלי להסתובב בתאים. ולשאול שאלות בקול רם, צריך ללכת ולעמוד ליד מצנן המים לעשות ניתוחים השוואתיים עם אנשים או ללכת לשאול את הקבלה היכן נמצא המדד. אם הם יכולים לעשות זאת בהישג ידם והם יכולים לקחת את זה לפגישות שלהם איתם ולשבת בחדר דירקטוריונים מדפדף במסכים בזמן אמת ולא בהעתקה, פתאום העצמנו את הצוות שלנו שלא צריך להיות אמיתי מדעני נתונים, אך כדי להשתמש בפועל במדעי נתונים ולהביא לתוצאות מדהימות עבור ארגונים. ואני חושב שנקודת ההפצה הזו שעברנו דווקא עכשיו בה הצרכן מונע לארגון, האתגר הוא איך אנו מספקים את אותו מיזם, וזה הנושא שאני מניח בדיון של היום. ועם זה, אני הולך לעטוף את הקטע שלי ולהעביר לידי לשמוע איך אנחנו יכולים לפתור את זה. דייוויד, אליך.

דייוויד סווינור: בסדר, תודה רבה לך חבר'ה, ותודה רובין. אתה יודע, רובין, אני מסכים להערכה המקורית שלך. תהליך אנליטי, זה לא שונה באמת מפיתוח תוכנה. אני חושב שהאתגר בארגון הוא פשוט באמת, אתה יודע, אולי הדברים אינם מוגדרים היטב, אולי יש בזה מרכיב גישוש, ומרכיב יצירתי בזה. ודז, אתה יודע, אני מסכים איתך, יש המון להמציא את הגלגל מחדש, ואתה יודע, אין ארגון שאני נכנס אליו היום, אתה שואל, ובכן, למה אתה עושה את זה ככה? מדוע העסק מתנהל כך? וקל לחקירה, והרבה פעמים כשאתה בתוך ארגון, קשה לשנות. אני אוהב את האנלוגיה, צרכנות של דברים. וכך כבר לא כשאני הולך לשדה התעופה ורוצה להחליף מושב - אני עושה את זה בסלולרי. אני לא צריך לגשת לסוכן בביתן, ולראות את הסוכן הזה מקליד משהו בצג מונוכרום למשך 15 דקות כדי לשנות את מטלת המושב שלי. אני פשוט מעדיף לעשות את זה בטלפון שלי, ולכן זו התפתחות מעניינת.

היום, נדבר מעט על אינטליגנציה קולקטיבית. למי שלא מודע, סטטיסטיקה היא פלטפורמת ניתוחים מהשורה הראשונה, והיא קיימת כבר למעלה משלושים שנה. אם אתה מסתכל על אחד מהפרסומים שקיימים בתעשיית האנליסטים, זה תמיד יוצא למעלה כאחת מחבילות תוכנת האנליטיקס המתקדמות והאינטואיטיביות והקלות ביותר לשימוש. אז העברנו את השנים האחרונות בעבודה על מושג שנקרא אינטליגנציה קולקטיבית, ואנחנו לוקחים אותו לשלב הבא. רציתי להתחיל את השיחה הזו עם: איך מתבצעים העבודה בארגון שלך?

ויש כאן שתי תמונות. זה משמאל הוא דימוי משנות השישים, ולא התחלתי את הקריירה שלי בשנות השישים, אבל הדימוי מימין הוא - זה מפעל למוליכים למחצה בו התחלתי לעבוד. ואני עבדתי בבניין השחור ההוא, על הגג השחור למעלה משמאל. אבל הם עשו דברים מוליכים למחצה. זו תמונה אחרונה מתמונות גוגל. אבל כשחוזרים לתמונת שנות השישים משמאל, זה מאוד מעניין. יש לך את האנשים האלה שיושבים בתור והם מייצרים, אתה יודע, מעגלים משולבים ומוליכים למחצה. אבל יש סטנדרטיזציה, יש דרך סטנדרטית לעשות דברים והיה תהליך מוגדר היטב. אתה יודע, אולי מכיוון שהאנשים האלה יושבים בסביבה פתוחה, אולי היה שיתוף פעולה כלשהו. אני חושב שאיבדנו מעט מזה בתוך כוח העבודה בידע.

כשישבתי בבניין ההוא בחלק השמאלי העליון, אם הייתי רוצה לשתף פעולה עם מישהו, הוא לא היה פתוח. היו המשרדים האלה, אולי חלק מהצוות היה מרוחק, או אולי הייתי צריך לנסוע ברחבי הקמפוס הזה; זה היה 25 דקות הליכה והייתי צריך ללכת לדבר עם מישהו בבניין בצד ימין. אני חושב שאיבדנו משהו בדרך. וכך, אתה יודע, הייתה לי אותה מחשבה, מדוע אנשים - כמה אנשים ממשיכים להמציא מחדש את הגלגל בארגון שלך? אני חושב, אתה יודע, ארגונים בכללותם עשו עבודה טובה בשנות התשעים וה -2000 עם CRM ואחסון נתונים, ובמידה מסוימת BI. מסיבה כלשהי, האנליטיקס קצת מפגר. היו השקעות משמעותיות באחסון נתונים, וסטנדרטיזציה ונורמליזציה של הנתונים שלך, וכל זה, ו- CRM, אולם ניתוחים מפגרים משום מה. ואני תוהה מדוע. אולי יש קריאייטיב - אולי התהליך שלך אינו מוגדר היטב, אולי אינך יודע לאיזו החלטה או מנוף אתה מנסה להפוך, אתה יודע, בעסק שלך לשנות דברים. כשאנחנו נכנסים לארגונים כיום, יש הרבה אנשים שעושים דברים בצורה ידנית מאוד בגיליונות אלקטרוניים.

ואתה יודע, התבוננתי בסטטוס הבוקר, אני חושב שהוא אמר 80, 90 אחוז מגיליונות האלקטרוניים טועים, וחלקם יכולים להיות משמעותיים מאוד. כמו זו שבוויתן, שם JPMorgan Chase הפסידה מיליארדים ומיליארדי דולרים בגלל שגיאות בגיליונות אלקטרוניים. אז יש לי הנחת יסוד לדעתי, צריכה להיות דרך טובה יותר לעשות דברים. וכפי שהזכרנו, יש לנו מדעני נתונים אלה. החבר'ה האלה יקרים, וקשה למצוא אותם. ולפעמים הם קצת ברווז מוזר. אבל אני חושב, אתה יודע, אם הייתי צריך לסכם מה זה מדען נתונים, זה כנראה מישהו שמבין את הנתונים. אני חושב שמישהו מבין את המתמטיקה, מישהו שמבין את הבעיה. ובאמת, מישהו שיכול לתקשר את התוצאות. ואם אתה מדען נתונים, יש לך מזל טוב מאוד בימינו, מכיוון שכך שכרך כנראה הוכפל בשנים האחרונות.

אבל האמת, הרבה ארגונים, אין להם מדעני נתונים אלה, אבל לארגון שלך יש אנשים חכמים. יש לך ארגון, יש לך הרבה אנשים חכמים, והם משתמשים בגיליונות אלקטרוניים. אתה יודע, סטטיסטיקה ומתמטיקה אינם תפקידם העיקרי, אך הם משתמשים בנתונים כדי להניע את העסק קדימה. האמת, האתגר שאליו אנו מתמודדים הוא כיצד אתה לוקח, אם יש לך מזל שיש לך מדען נתונים או סטטיסטיקאי או שניים, איך אתה יכול לקחת אותם ואיך אתה יכול לשפר את שיתוף הפעולה בין האנשים האלה לבין אנשים אחרים בארגון שלך? אם נסתכל על אופן הבניין של הארגון שלנו, אני הולך להתחיל ואני הולך מימין לשמאל. ואני יודע שזה הפוך, אבל יש לנו את קו המשתמשים הזה.

זהו עיקר אוכלוסיית עובדי הידע שלך, ולאנשים אלה אתה צריך להטמיע ניתוח בשורה של היישומים העסקיים שלך. אולי הם רואים פלט אנליטי במסך של מוקד טלפוני או משהו, וזה אומר להם את ההצעה הטובה ביותר הבאה שתוכל לתת ללקוח. אולי זה צרכן או ספק בפורטל אינטרנט, וזה מייד נותן להם קרדיט, או דברים כאלה. אבל הרעיון הוא שהם צורכים ניתוחים. אם נלך לאמצע, אלה עובדי הידע האלה. אלה האנשים שעושים דברים עם הגיליונות האלקטרוניים כיום, אך הגליונות האלקטרוניים מועדים לטעות ובשלב מסוים נגמר להם הדלק. מדעני נתוני אזרחים אלה, כפי שאנו מכנים אותם, אתם יודעים, מה שאנחנו מנסים לעשות עבורם זה באמת להגדיל את רמת האוטומציה.

ואתה שומע באנליטיקה ש -80 עד 90 אחוז מהעבודה הוא בקטע של הכנת נתונים, וזה לא המתמטיקה בפועל, אבל זה הכנת הנתונים. אנו מנסים להפוך את זה לאוטומטי, בין אם אתה עושה זאת, ויש לנו מכשפים ותבניות ודברים שניתן לעשות בהם שימוש חוזר, ואתה לא באמת צריך להיות בעל ידע על התשתית הבסיסית בסביבתך. ואז אם אנו מסתכלים בצד שמאל, יש לנו מדעני נתונים אלה. וכמו שציינתי, הם במחסור. ומה שאנחנו מנסים לעשות כדי להפוך אותם לפרודוקטיביים יותר, הוא לאפשר להם ליצור דברים שמדענים הנתונים האזרחיים האלה יכולים לעשות. חשבו על זה כמו חסימת לגו, כך שמדענים נתונים אלו יכולים ליצור נכס לשימוש חוזר בו מדען נתונים אזרח יכול להשתמש. בנה את זה פעם אחת, כדי שלא נצטרך להמשיך להמציא את הגלגל מחדש.

ואז גם, החבר'ה האלה עשויים להיות מודאגים אם נוכל לעשות דברים בבסיס הנתונים, ולמנף את ההשקעות הטכנולוגיות הקיימות שהחברה שלך ביצעה. אתה יודע, זה לא הגיוני בימינו בעידן זה לערבב נתונים הלוך ושוב בכל רחבי העולם. אז אם אנו מסתכלים על סטטיסטיקה, כמו שציינתי, זו פלטפורמה שקיימת כבר די הרבה זמן. וזה מוצר מאוד חדשני. מיזוג נתונים, לא היה מקור נתונים שאיננו יכולים לגשת אליו. יש לנו את כל הדברים של גילוי נתונים והדמיה שהייתם מצפים להם; אנו יכולים לעשות זאת בזמן אמת. וכנראה שיש לו - אני חושב שיש יותר מ 16, 000 פונקציות אנליטיות בכלי התוכנה, כך שזה מתמטיקה יותר ממה שאי פעם הייתי יכול להשתמש או להבין, אבל זה שם אם אתה צריך את זה.

יש לנו את היכולת לשלב גם כללים עסקיים וגם תזרימי עבודה אנליטיים בכדי לקבל החלטה עסקית באמת. אתה הולך מעבר לצודק, הנה אלגוריתם, הנה זרימת עבודה, אבל יש לך כללים עסקיים שתמיד צריך להתמודד איתם. אנחנו מאוד בטוחים בממשל. אנו משתמשים בהרבה מאוד לקוחות פרמצבטיים בכך שה- FDA סומך עלינו. אתה יודע, רק הוכחה בפודינג כי יש לנו את השליטה ויכולת הביקורת להתקבל על ידיהם. ואז לבסוף, אתה יודע, אנחנו פתוחים וגמישים וניתנים להרחבה, אז אתה צריך ליצור פלטפורמה שהיא, אתה רוצה שמדעני הנתונים שלך יהיו פרודוקטיביים, אתה רוצה שמדעני הנתונים האזרחיים שלך יהיו פרודוקטיביים, אתה רוצה להיות מסוגל לפרוס את הפלט האנליטי הזה לעובדים בארגון שלך.

אם נסתכל על זה, הנה דוגמה לכמה מהמחשות. אבל היכולת להפיץ את התפוקה האנליטית למשתמשים עסקיים, כך שהדוגמא הראשונה משמאל, זה תרשים אנליטי ברשת. ואולי אתה חוקר הונאה, ואתה לא יודע איך נוצרים קשרים אלה, וזה יכול להיות אנשים, אלה יכולים להיות ישויות, אלה יכולים להיות חוזים, כל דבר באמת. אבל אתה יכול לתפעל את זה עם העכבר שלך, ולתקשר איתו כדי להבין באמת - אם אתה חוקר הונאה, להבין רשימה מתעדפת של מי ללכת לחקור, נכון, מכיוון שאתה לא יכול לדבר עם כולם, אז יש לך לתעדף.

אם אנו מסתכלים על התמונה בצד ימין שם, עבור לוח מחוונים לתחזוקה חזוי, זו בעיה ממש מעניינת. אולי אתה בעל שדה תעופה, ויש לך שם את סורקי הגופות האלה. סורקי הגוף האלה, אם אתה הולך לשדה תעופה, ישנם כמה רכיבים שם שיש להם חיי מדף של תשעה חודשים. והדברים האלה הם ממש ממש יקרים. אם יש לי מספר נקודות כניסה, סורקים מרובים בשדה התעופה שלי, מספר אחת אני רוצה לוודא שאויש אותי כראוי בכל אחד מהשערים, ולגבי החלקים שנמצאים בסורקים, אני לא רוצה להזמין אותם מדי מוקדם, ואני כן רוצה שיהיה להם לפני שזה יתקלקל. יש לנו יכולת, אולי אם אתה הבעלים של שדה תעופה, להיות מסוגלים לחזות מתי הדברים האלה ישברו ולחזות את רמות הצוות.

אם אנו מסתכלים על הימני התחתון, זה אם אתם בסביבת ייצור, זהו רק ייצוג גרפי של זרימת הייצור. וקצת קשה לראות, אבל יש רמזורים אדומים וירוקים במגזרי התהליכים השונים האלה, ולכן אם אני מהנדס, יש שם מתמטיקה מאוד מתוחכמת, אבל אני יכול להתעמק בענף התהליכים הספציפי הזה ולהסתכל על הפרמטרים והקלט שאולי גורם לכך שהוא יוצא מכלל שליטה. אם אנו מסתכלים על מדען נתוני האזרח שלנו, מטרתנו היא להקל על מדען הנתונים האזרחיים. יש לנו אשפים ותבניות, ודבר אחד שלדעתי ממש מעניין הוא שיש לנו את צומת בדיקת הנתונים האוטומטית. ובאמת מה זה עושה, יש בו חכמים מובנים.

הזכרתי הכנת נתונים - זה לוקח זמן משמעותי, זה גם בצבירת נתונים וגם בהכנתם. אבל בואו נניח שיש לי את הנתונים שלי, אני יכול להריץ אותם דרך צומת הבדיקה לבריאות הנתונים, והוא בודק אם מדובר באי-שוויון, בדלילות, ובמחשבים, וכל הדברים האלה, זה ממלא ערכים חסרים וזה עושה הרבה מתמטיקה שאני לא אני לא מבין, אז אני יכול לקבל את ברירת המחדל, או אם אני קצת יותר מתחכם, אני יכול לשנות אותם. אבל העניין הוא שאנחנו רוצים להפוך את התהליך לאוטומטי. הדבר הזה עושה בערך 15 בדיקות ותוצאות שונות במערך נתונים מנוקה. מה שאנחנו עושים זה להקל על אנשים ליצור את זרימות העבודה האלה.

כאן אנו מדברים על שיתוף פעולה בין מדעני הנתונים לבין מדעני נתונים אזרחיים. אם אנו מסתכלים על התמונות הללו מצד ימין, אנו רואים את זרימת העבודה של הכנת נתונים זו. ואולי זה מאוד מתוחכם, אולי זה הרוטב הסודי של החברה שלך, אני לא יודע, אבל אנחנו יודעים שמישהו בתוך הארגון שלך יכול לגשת לאחד או יותר ממגורות הנתונים האלה שיש לנו. אנחנו צריכים דרך, מספר אחת, לתפוס אותם ולתפור אותם יחד, ומספר שני, אולי יש עיבוד מיוחד שאנחנו רוצים לעשות, שזה מעבר לבדיקת בריאות הנתונים שלנו, וזה הרוטב הסודי של החברה שלך. אני יכול ליצור את זרימת העבודה הזו בתוך הארגון שלנו, והוא קורס כצומת. אתה רואה את החץ שמצביע כלפי מטה, זה רק צומת, ואנחנו יכולים להיות מאה מהדברים האלה בתוך ארגון. הרעיון הוא שיש לנו אנשים שיודעים משהו על מרחב מסוים, הם יכולים ליצור זרימת עבודה ומישהו אחר יכול לעשות בו שימוש חוזר. אנו מנסים למזער את ההמצאה המחודשת של הגלגל.

ואנחנו יכולים לעשות את אותו הדבר בזרימות עבודה של דוגמנות אנליטיות. במקרה זה מצד ימין, זרימת העבודה הזו, אולי יש 15 אלגוריתמים שונים, ואני רוצה לבחור את הטוב ביותר למשימה. ואני לא צריך להבין כמדען נתונים אזרחיים מה קורה בבלגן העכביש ההוא שם למעלה, אבל זה פשוט קורס לצומת, ואולי הצומת הזה פשוט אומר, "חישוב ציון סיכון אשראי." "חישוב הסיכוי של זיהום באתר כירורגי, "מה יש לך "חישוב ההסתברות לכך שמשהו יהיה עסק בהונאה." כמדען נתונים לאזרח, אני יכול להשתמש במתמטיקה המתוחכמת הזו שמישהו אחר בנה, אולי אחד מאותם נתונים שמדענים בנה בארגון שלי.

מנקודת מבט של מדעי נתונים, אתה יודע, דיברתי עם מדעני נתונים שאוהבים לכתוב קוד ודיברתי עם מדעני נתונים ששונאים לכתוב קוד. וזה בסדר, אז יש לנו ממשק משתמש ויזואלי מאוד גרפי. אנחנו יכולים לתפוס את הנתונים שלנו, אנחנו יכולים לעשות את בדיקת הנתונים האוטומטית שלנו ואולי אני רוצה לכתוב קוד. אני אוהב את פייתון, אני אוהב את R, אבל הרעיון הוא שמדעני הנתונים האלה הם במחסור, והם אוהבים את הקוד בשפה מסוימת. אין לנו העדפה במיוחד לאיזו שפה תרצו לתקן, כך שאם אתם רוצים לעשות R, עשו R; אם אתה רוצה לעשות פייתון, עשה את פייתון. זה מצוין. אם אתה רוצה לפרוץ את הניתוח שלך ל- Azure, פרץ את הניתוח שלך לענן. וכך המטרה כאן היא באמת להציע גמישות ואפשרויות להפוך את מדעני הנתונים שלך לפרודוקטיביים ככל שיהיו.

עכשיו מדעני נתונים, הם אנשים חכמים למדי, אבל אולי הם לא מומחים בכל דבר, ואולי יש כמה פערים במה שהם יכולים לעשות. ואם אתה מסתכל על הענף, יש הרבה מקומות שוק אנליטיים שקיימים שם. זו דוגמה לכך, אולי אני צריך לעשות זיהוי תמונה ואין לי את המיומנות הזו, ובכן אולי אני יוצא לאלגוריתמיה ולקבל אלגוריתם לזיהוי תמונות. אולי אני יוצא לאפרויטה ומקבל אלגוריתם בריאותי מאוד מיוחד. אולי אני רוצה להשתמש במשהו בספריית הלמידה של מכונות Azure. אולי אני רוצה להשתמש במשהו בפלטפורמה המקורית של סטטיסטיקה.

שוב, הרעיון כאן הוא שאנחנו רוצים למנף את קהילת האנליטיקס העולמית. מכיוון שלא תהיה לך את כל המיומנויות בארבעת הקירות שלך, אז איך נוכל ליצור תוכנה - וזה מה שאנחנו עושים - שמאפשר למדעני הנתונים שלך להשתמש באלגוריתמים ממגוון מקומות שוק. אנחנו עושים את זה עם R ופייתון כבר הרבה זמן, אבל זה מרחיב את זה לשווקי האפליקציות האלה שקיימים שם בחוץ. ואותו דבר שאתה רואה כאן בראש זה, אנו משתמשים ב- H2O ב- Spark, כך שיש שם המון אלגוריתמים אנליטיים. אתה לא צריך להתמקד ביצירת אלה מהתחלה, בוא נעשה שימוש חוזר באלה שחיים בקהילת הקוד הפתוח, ואנחנו רוצים שהאנשים האלה יהיו פרודוקטיביים ככל האפשר.

השלב הבא, אחרי שיש לנו מדעני נתונים אזרחיים ומדעני הנתונים שלנו, הוא באמת איך מקדמים ומפיצים את שיטות העבודה המומלצות הללו? יש לנו טכנולוגיה בתוכנה שלנו המאפשרת לך להפיץ ניתוחים בכל מקום. וזה יותר מבט של ניהול מודלים, אבל אני כבר לא מחויב לארבעת הקירות או למתקן ספציפי בטולסה או בטייוואן או בקליפורניה, או מה יש לך. זוהי פלטפורמה גלובלית, ויש לנו לקוחות רבים ורבים שהיא נפרסת בשימוש בה על ידי אתרים מרובים.

וכך באמת, הדברים העיקריים הם שאם אתה עושה משהו בטייוואן ואתה רוצה לשכפל אותו בברזיל, זה נהדר. היכנס לשם, אחז בתבניות הניתנות לשימוש חוזר, אחוז בזרימות העבודה הרצויות. זה מנסה ליצור את הסטנדרטים האלה, ואת הדרך הנפוצה לעשות דברים, כך שאנחנו לא עושים דברים שונים לחלוטין בכל מקום. ומרכיב המפתח האחר בזה, הוא באמת שאנחנו רוצים לקחת את המתמטיקה למקום בו הנתונים חיים. אתה לא צריך לערבב נתונים בין קליפורניה לטולסה לבין טייוואן וברזיל. יש לנו טכנולוגיה שמאפשרת לנו לקחת את המתמטיקה לנתונים, ואנחנו הולכים לעשות שידור אינטרנט נוסף של Hot Technology בנושא זה.

אבל אנו קוראים לאדריכלות זו, והנה הצצה גמודה, ארכיטקטורת אנליטיקס מבוזרת של Native. הרעיון המרכזי שמאחורי זה הוא שיש לנו פלטפורמה, סטטיסטיקה, ואני יכול לייצא זרימת עבודה אנליטית כאטום. ויכולתי לעשות מודל, או זרימת עבודה שלמה, כך שזה לא משנה. אבל אני יכול ליצור את זה ולייצא אותו בשפה המתאימה לפלטפורמת היעד. בצד השמאלי של זה, הרבה אנשים עושים זאת, אבל הם עושים ניקוד במערכת המקור. זה בסדר, אנחנו יכולים לעשות ניקוד ואנחנו יכולים לבנות מודלים בבסיס הנתונים, אז זה מעניין.

ואז בצד ימין, יש לנו את בומי. זו טכנולוגיה נלווית, אנו עובדים עם כל אלה. אך אנו יכולים גם לקחת את זרימות העבודה הללו, ולמעשה להעבירם לכל מקום בעולם. כל דבר שיש לו כתובת IP. ואני לא צריך להתקין סטטיסטיקה בענן הציבורי או הפרטי. כל דבר שיכול להריץ JVM, אנו יכולים להריץ את זרימות העבודה האנליטיות, את זרימות העבודה של הכנת נתונים, או סתם דגמים באחת מפלטפורמות היעד הללו. בין אם זה בענן הציבורי או הפרטי שלי, בין אם זה בטרקטור שלי, ברכב שלי, בבית שלי, בנורה שלי, באינטרנט הדברים שלי, יש לנו טכנולוגיה שמאפשרת לך להעביר את זרימי העבודה האלה לכל מקום בעולם.

בואו נסקור. אתה יודע, יש לנו שורה של משתמשים עסקיים, אז אנשים, יש לנו טכנולוגיה מאפשרת להם לצרוך פלט בפורמט שהם נוחים אליו. יש לנו מדעני נתונים על אזרחים, ומה שאנחנו מנסים לעשות זה לשפר את שיתוף הפעולה, להפוך אותם לחלק מצוות, נכון? וכך אנו רוצים שאנשים יפסיקו להמציא את הגלגל מחדש. ויש לנו מדעני נתונים אלה, יכול להיות שם פער מיומנות, אבל הם יכולים לקוד בשפה שהם רוצים, הם יכולים ללכת למקומות השוק האנליטיים ולהשתמש שם באלגוריתמים. וכך עם זה, איך לא יכולתם לחשוב שהכל מדהים עם זה? זה מושלם, זה מה שאנחנו עושים. אנחנו בונים זרימות עבודה שניתנות לשימוש חוזר, אנו נותנים לאנשים הוראות, אנו נותנים להם את אבני הלגו כדי שיוכלו לבנות את הטירות האדירות האלה וכל מה שהם רוצים לעשות. לסיכום, יש לנו פלטפורמה שמאפשרת להעצים קו של משתמשים עסקיים, מדעני נתונים אזרחיים, מדעני נתונים מתכנתים ויש לנו - נוכל לטפל בכל סוג של מקרה של ניתוח אנליטי של קצה IoT, ואנחנו מאפשרים את התפיסה הזו של אינטליגנציה קולקטיבית. עם זה, אני חושב שכנראה נפתח את זה לשאלות.

רובין בלור: טוב בסדר. אני חושב שהראשון - כלומר, אם להיות כנה, אני מתכוון שקיבלתי תדרוך על ידי דל סטטיסטיקה בעבר, ולמען האמת, אני די מופתע מהדברים שלא ידעתי שהעלאת במצגת . ואני חייב לומר שהדבר האחד, זה משהו שדבב אותי בזכות אימוץ האנליטיקס, זה, אתה יודע, להשיג את הכלים לא, אתה יודע? יש שם המון כלים נוראיים, יש כלים בקוד פתוח וכן הלאה וכן הלאה, ויש מגוון דברים, מה שאכנה, פלטפורמות למחצה. אבל אני חושב שההבדל שיש לך, התרשמתי במיוחד מכמה מזרימת העבודה.

אבל נראה שההבדל מספק קצה לקצה. זה כמו שאנליטיקה היא תהליך עסקי מתוחכם שמתחיל ברכישת נתונים ואז היא עוברת סדרה שלמה של שלבים, תלוי עד כמה הנתונים מעורפלים, ואז היא יכולה להסתעף בסדרה שלמה של התקפות מתמטיות שונות ב נתונים. ואז תוצאות מתגלות בדרך זו או אחרת ואלו צריכות להיות פעולות. יש כמות אדירה של ניתוחים שנתקלתי בהם נעשתה עבודה רבה ומעולה, אבל אין שום אפשרות להפעיל אותה. ונראה שיש לך המון דברים נדרשים. אני לא יודע כמה זה מקיף, אבל זה דרך יותר מקיפה ממה שציפיתי. אני מאוד מתרשם מזה.

אני רוצה שתגיב על גיליונות אלקטרוניים. אמרת כבר משהו, אבל אחד הדברים שציינתי וציינתי במהלך השנים, אבל זה פשוט נעשה יותר ויותר ברור, זה שיש המון גיליונות אלקטרוניים שהם מערכות צל ובאמת אני חושב הגיליון האלקטרוני, כוונתי, זה היה כלי נפלא כשהוא הוצג וזה היה נפלא מאז בהרבה אופנים שונים, אבל זה כלי כללי, הוא לא ממש מתאים למטרה. זה בהחלט לא טוב בהקשר של BI ולדעתי זה נורא בהקשר האנליטי. ותהיתי אם יש לך הערה כלשהי לגבי, בואו נגיד, דוגמאות בהן, אתה יודע, סטטיסטיקה פרצה, שימוש מוגזם בגיליונות אלקטרוניים, או כל תגובה שתרצה להעיר בנושא?

דייוויד סווינור: כן אני חושב שאתה יודע שאתה יכול לחפש טעויות בגיליונות אלקטרוניים מפורסמים. גוגל או כל מנוע חיפוש כלשהו בו אתה משתמש יחזרו עם מספר תוצאות. אני לא חושב, אתה יודע, נחליף אי פעם גיליונות אלקטרוניים. זו לא הכוונה שלנו, אבל הרבה ארגונים שאליהם אני הולך, יש כמה מכשפים או נינג'ות אלקטרוניים או כל מה שאתה רוצה לקרוא להם, אבל יש להם את הגליונות האלקטרוניים המתוחכמים האלה ועליכם לחשוב, מה קורה כאשר אלה אנשים זוכים בלוטו והם לא חוזרים? ולכן מה שאנחנו מנסים לעשות הוא שידוע לנו שגיליונות אלקטרוניים יתקיימו כדי שנוכל להכיל אותם, אבל אני חושב שמה שאנחנו מנסים לעשות זה לפתח ייצוג חזותי של זרימת העבודה שלך, כך שניתן יהיה להבין אותה ולשתף אותם עם אנשים אחרים . הגיליונות האלקטרוניים הם די קשים, די קשה לשתף. וברגע שאתה מעביר לי את הגיליון האלקטרוני, שיניתי אותו, ועכשיו איננו מסונכרנים ומקבלים תשובות שונות. מה שאנחנו מנסים לעשות זה לשים מעט מעקות סביב זה ולייעל את הדברים קצת יותר. וגיליונות אלקטרוניים ממש נוראים לשלב מערכי נתונים מרובים יחד, אתה יודע? הם נופלים שם. אבל אנחנו לא הולכים להחליף אותם, אנחנו נוטלים אותם ויש לנו אנשים שמתחילים לעבור כי אם יש לנו צומת שאומר "חישוב סיכון" זה מה שהאדם שמשתמש בגיליון האלקטרוני מנסה לעשות. אז אלה נעלמו.

רובין בלור: כן, אני מתכוון, הייתי אומר את זה, אתה יודע, מאחת הפרספקטיבות שאני מסתכל על הדברים, הייתי אומר שגיליונות אלקטרוניים נהדרים ליצירת מידע. הם אפילו נהדרים ליצירת איים של ידע, אבל הם ממש רעים לשיתוף ידע. אין להם שום מנגנון לעשות זאת בשום אופן, ואם אתה מעביר גיליון אלקטרוני למישהו, זה לא שאתה יכול לקרוא את זה כאילו זה מאמר שהסביר בדיוק מה הוא עושה. זה פשוט לא שם. אני חושב, אתה יודע, הדבר שהכי הרשים אותי במצגת וביכולותיה של סטטיסטיקה, זה נראה אגנוסטי להפליא. אבל יש לו חוט זה שעובר עליו זרימת עבודה. האם אני צודק בהנחה שאתה יכול להסתכל על זרימת עבודה מקצה לקצה ממש, ידוע לך, מרכישת נתונים לאורך כל הדרך ועד הטמעת תוצאות ביישומי BI מסוימים או אפילו הפעלת יישומים?

דייוויד סווינור: כן, בהחלט. ויש לזה יכולת מקצה לקצה וכמה ארגונים משתמשים בזה באופן מוחלט, ואני תחת שום אשליה אף חברה לא קונה בימינו הכל מספק אחד. יש לנו תמהיל. יש אנשים שמשתמשים בסטטיסטיקה לכל דבר ויש אנשים שמשתמשים בה לזרימות עבודה של דוגמנות, יש אנשים שמשתמשים בה בזרימות עבודה של הכנת נתונים. יש אנשים המשתמשים בה כדי להפיץ מאות דוחות הנדסיים למהנדסים. וכך יש לנו הכל בין לבין. וזה באמת מקצה לקצה וזה, אתה יודע, פלטפורמה אגנוסטית, בכך שאם יש אלגוריתמים שאתה רוצה להשתמש בהם ב- R או בפייתון, Azure, Apervita, מה שאתה יודע, השתמש בזה. זה נהדר, היה פרודוקטיבי, השתמש במה שאתה יודע, השתמש במה שאתה מרגיש בנוח ויש לנו מנגנונים כדי לוודא שאלו מבוקרים ושומרי ביקורות וכל מיני דברים כאלה.

רובין בלור: אני אוהב במיוחד את ההיבט הזה. כלומר, אני לא יודע אם אתה יכול לדבר מעבר למה שאמרת לעושר של מה שיש שם. זאת אומרת, הסתכלתי על זה אבל לא הסתכלתי על זה באופן מקיף ובטח שיש כמות אדירה של ספריות פייתון בספריות שלנו אבל האם יש משהו שתוכל להוסיף לתמונה הזו? כי אני חושב שזה דבר מאוד מעניין, אתה יודע, הרעיון שיהיו לך רכיבים שהיו אמינים, מכיוון שהכרת אנשים שונים שיצרו אותם ואנשים שונים המשתמשים בהם שאפשר להוריד. אתה יודע, אתה יכול להעשיר את מה שכבר אמרת על זה?

דייוויד סווינור: כן, אני חושב שכמה ממוצרי האפליקציות, אתה יודע, מקומות האלגוריתם שיש שם. לדוגמה, אתה יודע, ד"ר ג'ון קרומוול מאוניברסיטת איווה, הוא פיתח מודל שיחזה, שמשמש בזמן אמת בזמן שאנחנו מפעילים אותו, ייתן לך ציון אם אתה הולך להשיג זיהום באתר כירורגי. ואם הניקוד הזה מספיק גבוה הם ייקבעו התערבות בחדר הניתוח. זה מאוד מעניין. אז אולי יש בית חולים אחר שאינו גדול כל כך. ובכן, Apervita הוא שוק אפליקציות בריאות לניתוח. אתה יכול לחפש אחד מהרבה משווקי האפליקציות האלה, אתה יכול למצוא אחד ולהשתמש בו מחדש, והעסקה היא בינך לבין מי שבבעלותו, אבל אתה יכול ללכת למצוא אחד או שאתה יכול להגיד, "הנה אני חושב שזה רתימה של הקהילה הגלובלית מכיוון שכולם מומחים בימינו ואינך יכול לדעת הכל. אני חושב ש- R ו- Python הם דבר אחד, אבל הרעיון הזה של "אני רוצה לעשות את הפונקציה הזו, לשים שם מפרט באחד ממקומות שוק האפליקציות האלה ושיהיה מישהו שיפתח את זה בשבילך." והם יכולים לייצר רווח מזה, אני חושב זה מאוד מעניין ושונה מאוד מאשר מודל הקוד הפתוח בלבד.

רובין בלור: בסדר. בכל מקרה, אני אעביר את הכדור לדצ. האם תרצה לצלול פנימה, דז?

דז בלנשפילד: בהחלט והייתי רוצה להישאר על עניין הגיליון האלקטרוני רק לרגע כי אני חושב שהוא תפס את התמצית הנכונה של הרבה ממה שאנחנו מדברים כאן. והגבת תגובה, רובין, ביחס למעבר מסוג הגיליונות האלקטרוניים הישנים בצורתם הפיזית לצורה אלקטרונית. היה לנו דבר מעניין שמתרחש שם, אתה יודע, כאשר גיליונות אלקטרוניים היו במקור דבר שהם היו רק גיליונות נייר עם שורות ועמודות והיית כותב ידנית את הדברים, ואז אתה יכול לחשב אותם ולחשב אותם, או על ידי ביצוע זה מעל לראש או עם מכשיר אחר. אבל עדיין יש לנו את ההזדמנות שיש טעויות להחליק עם טעויות בכתב יד או דיסלקציה, ועכשיו החלפנו אותה בהקלדות הקלדה. הסיכון הוא שעם הגיליונות האלקטרוניים פרופיל הסיכון מהיר וגדול יותר, אבל אני חושב שהכלים כמו סטטיסטיקה הופכים את פירמידת הסיכון.

לעתים קרובות אני מצייר את התמונה הזו על לוח לבן של דמות מקל אנושית בחלקו העליון, כאדם אחד, ואז אוסף מהם בתחתית, נניח, דמיין עשרה מהם בתחתית הלוח ההוא, ואני מצייר הפירמידה שבה נקודת הפירמידה היא לאדם הבודד וכף הרגל של הפירמידה היא אוסף האנשים. ואני משתמש בזה כדי לדמיין את הרעיון שאם אדם אחד בחלק העליון עושה גיליון אלקטרוני טועה ומשתף אותו עם עשרה אנשים, ועכשיו יש לנו עשרה עותקים של השגיאה. היזהר מאוד עם פקודות המאקרו שלך והיה זהיר מאוד עם Visual Basic שלך אם אתה מתכוון לעבור לזה. כי כשאנחנו בונים כלים אלקטרוניים כמו גיליונות אלקטרוניים זה מאוד עוצמתי, אבל זה גם חזק בצורה טובה ורעית.

אני חושב שכלים כמו סטטיסטיקה מביאים ליכולת להפוך את פרופיל הסיכון הזה, וכעת תוכלו להגיע למצב בו יש לכם המון כלים העומדים לרשותו של האדם האישי וכאשר הם הולכים מהמון כלים בראש הפירמידה ואז למטה לתחתית שם נקודת הפירמידה שהופכת כעת היא הכלי בפועל, אם יש לנו צוות של אנשים שבונים את הכלים האלה ואת האלגוריתמים האלה. ומדען הנתונים אינו צריך להיות מומחה בניתוח רגרסיה על הנתונים שלהם. יתכן שהם יוכלו להשתמש בכלי, אך יתכן שיהיו לך חמישה או שישה סטטיסטיקאים ואקטואר ומדען נתונים וכמה מתמטיקאים שעובדים על הכלי הזה, המודול הזה, האלגוריתם ההוא, הפלאגין הזה וכך בסטנדרט הגיליונות האלקטרוניים, כך תאר לעצמך שכל גיליון אלקטרוני שפורסם בו תוכל להשתמש נכתב בפועל על ידי מומחים שבדקו את המקרו, בדקו את Visual Basic, דאגו שהאלגוריתמים יעבדו, כך שכשקיבלתם את זה תוכלו פשוט להקפיא לתוכו נתונים אבל לא יכולתם ממש לשבור אותם ולכן היה עדיף לשלוט.

אני חושב שרבים מכלי הניתוח עושים זאת. אני משער שהגעת לעניין זה, האם אתה רואה את זה בשטח עכשיו, אתה רואה את המעבר מגיליונות אלקטרוניים שעלולים לדחוף טעויות וטעויות ולהסתכן, עד לנקודה בה הכלים שאתה בונה בעזרתך פלטפורמות כעת, כשגילוי הנתונים מדויק בזמן אמת והאנשים שבונים את המודולים והאלגוריתמים מסירים או מצמצמים את פרופיל הסיכון הזה? האם שירות לקוחות רואה זאת במובן אמיתי או שאתה חושב שזה קורה והם לא מבינים זאת?

דייוויד סווינור: אתה יודע, אני חושב שיש כמה דרכים לענות על זה. אבל מה שאנחנו רואים הוא, אתה יודע, בכל ארגון, והזכרתי שאנליטיקות לדעתי אולי שמרו מנקודת מבט השקעה ארגונית, סוג של מה שעשינו עם אחסנת נתונים ו- CRM. אבל מה שאנחנו רואים, לכן, דרוש הרבה כדי לשנות ארגון, להתגבר על האינרציה הארגונית ההיא. אבל מה שאנחנו רואים זה שאנשים לוקחים את הגיליונות האלקטרוניים שלהם, לוקחים את זרימות העבודה שלהם, וציינתי את האבטחה והממשל, "ובכן, אולי יש לי גיליון אלקטרוני", "ובכן, אני יכול לנעול את זה ואני יכול לשלוט בזה בגרסאות." אנו רואים המון ארגונים, אולי הם פשוט מתחילים שם. ואם זה השתנה, יש זרימת עבודה ובסופו של דבר אני הולך, מספר אחת, מי שינה את זה? מדוע שינו את זה. כששינו את זה. ואני יכול גם להגדיר זרימת עבודה כזו שאני לא מתכוון להכניס גיליון אלקטרוני חדש זה לייצור אלא אם כן הוא מאומת ואומת על ידי אחד, שניים, שלושה, עם זאת, הרבה גורמים שתרצה להגדיר בזרימת העבודה שלך. אני חושב שאנשים מתחילים לנקוט, וארגונים מתחילים לנקוט שם צעדים לתינוק, אבל כנראה הייתי מציעה לנו עוד דרך ארוכה.

דז בלנשפילד: אכן ולדעתי בהתחשב בעובדה שאתה בונה גם את בקרות הביטחון וגם את הממשל שם, אז עומס העבודה יכול למפות אוטומטית את זה פנימה וכל הדרך עד לקצין הסיכון הראשי, שהוא עכשיו דבר. אתה יכול להתחיל לשלוט באופן בו ניגשים לכלים ומערכות אלה ומי עושה איתם מה, כך שזה מאוד עוצמתי. אני חושב שהדברים האחרים שנובעים מכך הם שסוגי הכלים שאתה מספק, בשבילי, משאילים להתנהגות אנושית יותר מאשר לגיליונות האלקטרוניים המסורתיים עליהם אנו מדברים, בכך שאם יש לי חדר מלא באנשים עם אותו לוח מחוונים וגישה לאותם נתונים שהם למעשה יכולים לקבל תצוגה שונה וכתוצאה מכך לקבל תובנות שונות במקצת מאותו מידע, שמתאים לצרכים שלהם, כך שיוכלו לשתף פעולה. לאחר מכן יש לנו השקפה אנושית יותר ואינטראקציה עם העסק ותהליך קבלת ההחלטות, לעומת כולם הולכים לאותה פגישה עם אותו PowerPoint, ואותם גיליונות אלקטרוניים המודפסים, כל אותם נתונים קבועים.

האם אתה רואה מעבר בהתנהגות ובתרבות בארגונים שממציאים את הכלים שלך עכשיו במקום שהם רואים את זה מתרחש, שם זה לא כמו חמישה אנשים בחדר שמסתכלים על אותה גיליון אלקטרוני ומנסים פשוט למלל אותו ולרשום עליו הערות, אבל עכשיו הם בעצם מתקשרים עם לוח המחוונים והכלים בזמן אמת, עם ויזואליזציה ואנליטיקה בהישג יד ומקבלים זרימה שונה לחלוטין על השיחה והאינטראקציה, לא רק בפגישות אלא רק בשיתוף פעולה כללי סביב הארגון? מכיוון שהם יכולים לעשות זאת בזמן אמת, מכיוון שהם יכולים לשאול את השאלות ולקבל תשובה אמיתית. האם זה טרנד שאתה רואה כרגע או שזה עדיין לא קרה עדיין?

דייוויד סווינור: לא, אני חושב שזה בהחלט התחיל בדרך ההיא ואני חושב שהדבר המעניין ביותר הוא, אתה יודע, אם ניקח לדוגמא מפעל של מפעל. אולי מישהו שבבעלותו מגזר תהליכים מסוים במפעל ההוא הוא רוצה להסתכל ולהתקשר עם נתונים אלה בצורה מסוימת. ואולי אני, המשקיף על כל התהליכים, אולי זה בתחתית, אולי אני רוצה להסתכל על זה על פני כל דבר. אני חושב שמה שאנחנו רואים הוא, מספר אחת, אנשים מתחילים להשתמש במערכת משותפת של הדמיות או הדמיות סטנדרטיות בתוך הארגונים שלהם, אבל זה גם מותאם לתפקיד שהם נמצאים בו. אם אני מהנדס תהליכים, אולי זו השקפה שונה מאוד ממי שמסתכל על זה מנקודת מבט של שרשרת האספקה, ואני חושב שזה נהדר מכיוון שיש להתאים אותו וצריך להסתכל עליו דרך העדשה שאתה צריך כדי לבצע את העבודה שלך.

דז בלנשפילד: אני מניח שתהליך ההחלטה יורד, בזמן ובמהירות, כדי לקבל החלטות חכמות ומדויקות עולה גם הוא במהירות, לא? מכיוון שאם יש לך ניתוחים בזמן אמת, לוחות מחוונים בזמן אמת, אם יש לך כלים סטטיסטיקה בהישג ידך, אתה לא צריך לרוץ לרצפה כדי לשאול מישהו על משהו, יש לך את זה בעותק קשיח. אתה יכול לשתף פעולה, ליצור אינטראקציה ולמעשה לקבל החלטות תוך כדי תנועה ולקבל את התוצאה הזו מייד. מה שלדעתי שחלק מהחברות באמת לא הבינו, אבל כשהם עושים זאת זה הולך להיות הרגע האירופי הזה, כן, אנחנו עדיין יכולים להישאר בתאים שלנו ולעבוד בבית, אבל אנחנו יכולים לקיים אינטראקציה ולשתף פעולה וההחלטות האלה אנו הופכים תוך כדי שיתוף פעולה להפוך לתוצאות באופן מיידי. תראה, אני חושב שזה היה פנטסטי לשמוע מה יש לך לומר עד כה ואני ממש מצפה לראות לאן זה הולך. ואני יודע שיש לנו המון שאלות בשאלות ותשובות, אז אני הולך לרוץ לרבקה כדי לעבור על כמה כאלה כדי שנוכל להגיע לאלו מהר ככל שתוכל. תודה רבה לך.

רבקה יוז'ויאק: תודה דז, וכן, דייב, יש לנו לא מעט שאלות מהקהל. ותודה גם לדז ורובין על התובנות שלך. אני יודע שהמשתתף הספציפי הזה היה צריך לרדת ממש בסוף השעה, אבל היא די מבקשת, האם אתה רואה שמחלקות מערכות המידע מעניקות עדיפות לבקרות נתונים מתוחכמות יותר מאשר סוג של להרגיש בנוח לספק כלים ל עובדי הידע? כלומר, האם זה - קדימה.

דייוויד סווינור: כן, אני חושב שזה תלוי בארגון. אני חושב שבנק, חברת ביטוח, אולי יש להם סדרי עדיפויות ודרכים שונות לעשות דברים, לעומת ארגון שיווקי. אני מניח שהייתי צריך להגיד שזה רק תלוי בענף ובפונקציה שאתה מסתכל עליהם. לתעשיות שונות יש מיקודים ודגש שונים.

רבקה יוז'ויאק: בסדר, זה הגיוני. ואז משתתף אחר רצה לדעת, מה המנוע שעומד מאחורי סטטיסטיקה? האם זה C ++ או הדברים שלך?

דייוויד סווינור: ובכן, אני לא יודע אם אוכל להשיג את זה ספציפי בכך שזה קיים כבר 30 שנה והוא פותח לפני זמני, אבל יש ספריית ליבה של אלגוריתמים אנליטיים שהם אלגוריתמים סטטיסטיים שפועלים. וראית כאן שאנחנו יכולים גם להריץ R, אנחנו יכולים להריץ את פייתון, אנחנו יכולים להתפרץ לתכלת, אנחנו יכולים לרוץ על ספארק ב- H2O, אז אני מניח שאצטרך לענות על השאלה הזו מבחינת, זה מגוון מנועים. ותלוי באיזה אלגוריתם תבחר, אם זה סטטיסטיקה הוא פועל כך, אם תבחר באחד ב- H2O וב- Spark, הוא משתמש בזה, ולכן הוא מגוון של אותם.

רבקה יוז'ויאק: טוב טוב. משתתף אחר שנשאל מצביע באופן ספציפי על השקופית הזו, רוצה לדעת, סוג של, כיצד מדען נתוני האזרח יודע באילו תבניות לשימוש חוזר להשתמש? ואני מניח שאעשה מזה סוגיה רחבה יותר. זאת, מה אתה רואה כשמשתמשים עסקיים או אנליסטים עסקיים נכנסים והם רוצים להשתמש בכלים אלה, כמה קל להם להרים ולהמשיך לרוץ?

דייוויד סווינור: אני מניח שהייתי עונה על כך ואם אתה יכול להשתמש בו, אם אתה מכיר את Windows, זו פלטפורמה מבוססת Windows, אז חתכתי את החלק העליון של צילומי המסך האלה, אבל יש לה את הסרט של Windows. אבל איך הם יודעים באיזו זרימת עבודה להשתמש? זה נראה כמו סייר Windows, כך שיש מבנה עץ ותוכל להגדיר אותו ולהגדיר אותו, אולם הארגון שלך רוצה להגדיר אותו. אבל יכול להיות, פשוט תהיה לך תיקיות אלה והיית שם תבניות לשימוש חוזר בתיקיות האלה. ואני חושב שיש כנראה שמות הנושאים שהחברה שלך יכולה לאמץ, נניח להלן "חישוב פרופיל הסיכון", הנה "קבל נתונים ממקורות אלה" ואתה קורא להם כל מה שאתה רוצה. זו רק תיקיה בחינם, אתה פשוט גורר את ההערות היישר אל הבד שלך. אז, די קל.

רבקה יוז'ויאק: טוב טוב. אולי הדגמה בפעם הבאה. ואז סוג אחר של משתתף מעלה, וזה על מה שאתה ורובין ודז דיברו ביחס לחוסר הדיוקים, במיוחד על גיליון אלקטרוני, אבל האשפה פנימה / זבל החוצה, והוא רואה את זה כיותר קריטי כשזה מגיע לניתוח. סוג של אזכור ש, אתה יודע, שימוש לרעה בנתונים באמת יכול להוביל להחלטות מצערות. והוא תוהה מהן השקפותיך לגבי פיתוח אלגוריתמים כישלוניים יותר, אני משער שבאמצעותו הוא משתמש במילה "שימוש קנאי" באנליטיקה. אתה יודע, מישהו נכנס, הם ממש מתלהבים, הם רוצים לעשות את הניתוחים המתקדמים האלה, הם רוצים להריץ את האלגוריתמים המתקדמים האלה, אבל אולי הם לא לגמרי בטוחים. אז מה אתה עושה כדי להבטיח סוג זה?

דיוויד סווינור: כן, אז אני מניח שאענה על זה הכי טוב שאני יכול, אבל אני חושב שהכל מסתכם באנשים, בתהליך ובטכנולוגיה. יש לנו טכנולוגיה שעוזרת לאפשר לאנשים ועוזרת לאפשר כל תהליך שתרצה להכניס בתוך הארגון שלך. בדוגמה של שליחת קופון למישהו, אולי זה לא קריטי, ואם זה דיגיטלי זה באמת ללא עלות, אולי יש רמה אחת של בקרות אבטחה ואולי לא אכפת לנו. אם אני חוזה זיהומים באתר כירורגי, אולי אני רוצה להיות קצת יותר זהיר. או אם אני צופה איכות ובטיחות תרופות ודברים כאלה, אולי אני רוצה להיות קצת יותר זהיר בנושא. אתה צודק, אשפה פנימה / זבל, אז מה שאנחנו מנסים לעשות זה לספק פלטפורמה שמאפשרת לך להתאים אותה לכל תהליך שאותו הארגון שלך רוצה לאמץ.

רבקה יוז'ויאק: טוב טוב. יש לי עוד כמה שאלות, אבל אני יודע שעברנו לא מעט את השעה ואני רק רוצה לספר למגישות שלנו, זה היה מדהים. ואנחנו רוצים להודות לכל כך דייב סווינור מדל סטטיסטיקה. כמובן שד"ר רובין בלור ודז בלנשפילד, תודה שהייתם האנליסטים היום. אנו הולכים להעביר שידור אינטרנט נוסף בחודש הבא עם Dell Statistica. אני יודע שדייב רמז על הנושא. זה יהיה על ניתוח בקצה, נושא מרתק נוסף, ואני יודע שמקרים מסוימים של שימוש משכנע מאוד יידונו בערוץ זה. אם אהבת את מה שראית היום, חזור לעוד חודש בחודש. ועם זה, אנשים, אני נפרד מכם. תודה רבה. ביי ביי.

הטמע ניתוחים בכל מקום: מאפשר לאנשי מדען הנתונים