על ידי צוות Techopedia, 22 בספטמבר 2016
ברק: המארחת רבקה יוז'ויאק דנה בניתוחי קצה עם ד"ר רובין בלור, דז בלנשפילד ושון רוג'רס של דל סטטיסטיקה.
אינך מחובר כרגע. התחבר או הירשם כדי לראות את הסרטון.
רבקה יוז'ויאק: גבירותיי ורבותיי, שלום, וברוכים הבאים ל- Hot Technologies משנת 2016. היום יש לנו "Edge Analytics: כלכלת ה- IoT סוף סוף." שמי רבקה ג'וזוויאק. אני אהיה המנחה שלך לשידור האינטרנט של היום. אנו מבצעים ציוץ באמצעות hashtag של # HOTTECH16 אם אתה רוצה להצטרף לשיחת הטוויטר.
אז ה- IoT, בהחלט נושא חם השנה ואינטרנט הדברים, זה באמת קשור לנתוני המכונה, נתוני חיישנים, נתוני יומן, נתוני מכשירים. אף אחד מהם אינו חדש, היו לנו נתונים מסוג זה לנצח, אך זה שלא ממש הצלחנו להשתמש בהם ועכשיו אנו רואים רק המון דרכים חדשות לשימוש בנתונים אלה. במיוחד בענף הרפואה, בשווקים הפיננסיים, עם נפט וגז, סחורות, מדובר בסך הכל בשפע של מידע שבעבר לא נוצל. ולא הרבה אנשים באמת הבינו כיצד לעשות זאת טוב. אנחנו מדברים על הרבה נתונים מועטים, אבל מדובר בהרבה נתונים, ואתה יודע, יש בעיות רשת, יש חומרה מעורבת, או שצריך לעבד אותה, ואיך אתה עושה זאת בלי לסתום את המערכת שלך? ובכן זה מה שנלמד עליו היום.
להלן מערך המומחים שלנו. יש לנו את ד"ר רובין בלור, האנליטיקאי הראשי שלנו בקבוצת בלור. יש לנו גם דז בלנשפילד, מדען הנתונים שלנו בקבוצת בלור. ואנחנו שמחים לקבל את שון רוג'רס, מנהל שיווק וערוצים עולמיים של Dell Statistica. ועם זה, אני הולך להעביר את הכדור לרובין.
ד"ר רובין בלור: אוקיי, תודה לך על זה. אני אלחץ על כפתור ואשליך שקופית. אין לי מושג מדוע יצרתי את התמונה האפוקליפטית הזו לאינטרנט של הדברים. אולי בגלל שלדעתי זה הולך להיות כאוטי בסופו של דבר. אני ממשיך ישר. זה מקביל לקורס בכל מצגת IoT. יש לך, בדרך זו או אחרת, לומר משהו מקומם לאן הכל הולך. ולמעשה, רוב זה כנראה נכון. אם אתה באמת מסתכל על הדרך בה עקומות אלה מתרחבות בהדרגה. אתה יודע, מחשבים אישיים, סמארטפונים וטאבלטים ככל הנראה ימשיכו לעלות. טלוויזיות חכמות כנראה יעלו. לבישים, הם כנראה מתפוצצים ברגע זה, לעומת מה שהיו לפני כמה שנים. מכוניות מחוברות, בלתי נמנעות כי כמעט כל המכוניות הולכות להיות מחוברות בצורה רחבה ויסודיות כל הזמן. וכל דבר אחר. והגרף הספציפי הזה של BI Intelligence מצביע על כך שכל השאר יעלה על הדברים הברורים מאוד מאוד מהר.
אז מה לומר על ה- IoT? הדבר הראשון הוא רק נקודה אדריכלית. אתה יודע, כשיש לך נתונים ועובדת אותך, בדרך זו או אחרת, תצטרך לחבר את השניים. ועם נתונים בכרכים שהם עכשיו, ואיסוף במקומות שונים, השניים כבר לא יחד באופן טבעי. הם היו בימי המיינפריים הישנים, אני מניח. כך שתוכלו לחשוב במונחים של שכבת עיבוד, שכבת תעבורה ושכבת נתונים. ובדרך זו או אחרת, שכבת ההובלה בימינו הולכת להעביר את העיבוד או להעביר את הנתונים לרשתות. אז הנה האפשרויות: אתה יכול להעביר את הנתונים לעיבוד, אתה יכול להעביר את העיבוד לנתונים, אתה יכול להעביר את העיבוד והנתונים לנקודת ביצוע נוחה, או שאתה יכול לפטר את העיבוד ולגרד את הנתונים. ובאשר לאינטרנט של הדברים, הנתונים כבר כמעט ונרדדו בלידתם, והסבירות היא שהרבה מאוד עיבוד הולך להיות מנוקד בכדי שהיישומים שצריכים להפעיל יתקיימו.
אז ציירתי תמונה. הדבר המעניין עבורי ב- IoT, אני מדבר על תחום צבירה בתרשים זה, ואני מציין שיש תחומי משנה. אז אתה יכול לדמיין שתחום IoT 1 כאן הוא מכונית מסוג כלשהו, ותחום 2 ותחום 3 ותחום 4, הם מכוניות מסוג כלשהו, ותצבור נתונים באופן מקומי, תפעיל אפליקציות מקומיות על אותם נתונים, תכניסו דברים שונים לפעולה. אבל כדי לקבל ניתוחים על כל המכוניות, תצטרך להעביר נתונים למרכז, לאו דווקא כל הנתונים, אבל תצטרך להצטבר במרכז. ואם אתה חושב על זה, ייתכן שתרצה שיהיו לך הרבה, הרבה תחומי צבירה שונים לאותה קבוצה של דברים של IoT. והדומיינים עצמם עשויים להצטבר עוד יותר. אז אתה יכול לקבל את ההיררכיה החוזרת על עצמה. ובעצם מה שיש לנו שם היא רשת מורכבת להפליא. הרבה יותר מורכב מכל מה שהיינו צריכים להיות לפני כן.
יש לי פתק בתחתית כאן. כל צמתי הרשת, כולל צמתי עלים, יכולים להיות יוצרי נתונים, מאגרי נתונים ונקודות עיבוד. וזה נותן לך אפשרות להפצה שכדומה לא ראינו קודם. דז הולך לדבר על זה יותר, אז אני אמשיך לנקודה הספציפית הזו. ברגע שאנחנו באינטרנט של הדברים וכל הנתונים למעשה החליטו להיות אירועים, העניין שקופית זו היא רק להצביע על כך שאנו נצטרך לתקנן אירועים. נצטרך, לכל הפחות, נצטרך לקבל את זה. אנו עומדים לרשות את הזמן בו התרחש האירוע, את המיקום הגאוגרפי בו הוא התרחש, את המיקום הווירטואלי או הלוגי של התהליך שיצר אותו, את התקן המקור שיצר אותו, את מזהה המכשיר כדי שתדע בדיוק איזה מכשיר מקור יצר אותו, בעלות של הנתונים והשחקנים, אותם אנשים שיש להם זכות להשתמש בנתונים בצורה כזו או אחרת, הם יצטרכו לשאת איתם את ההרשאות שלהם, מה שאומר שבאמת, זה יצטרך לשאת איתם אבטחה ואז יש הנתונים עצמם. וכשאתה מסתכל על זה אתה מבין את זה, אתה יודע, גם אם יש לך חיישן שאינו עושה יותר מלדווח על הטמפרטורה של משהו בכל שנייה בערך, יש למעשה די הרבה נתונים רק כדי לזהות היכן הנתונים בדיוק מקורו ומה הוא בעצם. אגב, זו לא רשימה ממצה.
אז מבחינת נוף ה- IT העתידי, הדרך שאני רואה את זה היא: זה לא רק האינטרנט של הדברים, יש גם את העובדה שאנחנו נהיה בעולם של פעילויות מונעות אירועים, ולכן אנחנו יצטרכו להיות ארכיטקטורות מונחות אירועים, וארכיטקטורות אלו יצטרכו לרחוב רשתות גדולות. והדבר האחר הוא הכל בזמן אמת, זה לא בהכרח המקרה שאנחנו צריכים להיות בזמן אמת, אבל יש משהו שאני מתייחס אליו כזמן עסקי וזה הזמן בו נתונים חייבים להיות מוגשים ומוכנים. לעובד. יתכן וזה לא, אתה יודע, אלפית השנייה אחרי שהיא נוצרה. אבל תמיד יש זמן כזה לכל פיסת נתונים וברגע שיש לך ארכיטקטורה מונעת אירועים זה מתחיל להיות יותר הגיוני לחשוב במונחים של גישה בזמן אמת לאופן שבו העולם עובד.
אז להרתיח את זה, כי מה שאנחנו באמת מדברים עליו זה ניתוח ב- IoT. למרות כל זאת, זה עדיין הכל זמן לתובנה, וזה לא רק זמן לתובנה, תובנות צריכות להיות אחריהן פעולות. לכן, זמן לתובנה וזמן לפעולה זה מה שהייתי מרתיח את זה. לאחר שאמרתי את זה, אני אחזיר את הכדור לדצ.
דז בלנשפילד: תודה, רובין. תובנה כתמיד. אני אוהב את העובדה שמדובר במעשה קשה לעקוב אחר כל מופע, אבל אעשה כמיטב יכולתי.
אחד הדברים שאני רואה, ולעתים קרובות אני מתבדר בזה, להיות כנים, ולא בצורה מלוכסנת ושלילית, אבל יש הרבה דאגה ופאניקה לאינטרנט של דברים שמשתלטים על העולם ושוחט אותנו ותתחיל לאבד את הנתונים שלך, אז אני רוצה להסתכל קצת אחורה על כמה דברים שעשינו בעבר בשני-שלושה העשורים האחרונים שהיו פקסימיליה קרובה לאינטרנט של דברים, אבל אולי לא ממש באותה סולם. ורק כדי להראות לעצמנו שבעצם היינו כאן ופתרנו חלק מהבעיות, לא ברמת הסולם הזו ולא במהירות הזו. מכיוון שזה אומר שאנחנו באמת יכולים לפתור את הבעיה ושאנו יודעים מהן חלק מהתשובות; פשוט עלינו לצוד ולהשתמש מחדש בכמה מההתמודדות שהיו לנו קודם. ואני יודע שזו כל השיחה שעומדת לנהל בי ויש לי מגוון שלם של דברים מהנים רק כדי לשוחח עליהם בסעיף שאלות ותשובות.
אבל כשאנחנו חושבים על האינטרנט של הדברים במעגל, ישנה מידה רבה של ריכוזיות ברמה עיצובית שנכתבה בימים הראשונים מאוד. מכשירי Fitbit למשל, כולם נוטים להגיע למקום מרכזי אחד וסביר להניח שהוא יתארח בפלטפורמת ענן איפשהו וכל הנתונים מכל אותם מכשירים פוגעים זהים, בואו נגיד, הקצה הקדמי של ערימה, כולל אינטרנט ו- שירותים מבוססי אפליקציות ונתונים. אך לאורך זמן, הסולם הזה ידרוש הנדסה מחודשת בכדי להתמודד עם כמות הנתונים המגיעים אליהם והם יעבדו מהנדס כך שיהיו מספר חזיות קדומות והעתקים מרובים של הערימה במספר מיקומים ואזורים. ואנחנו רואים זאת ויש מספר דוגמאות שאני הולך לתת לך שנוכל לדון בהן.
נקודת המפתח בכך היא שלמרות שראינו כמה מהפתרונות האלה שאני עומד לכסות, קנה המידה והנפח של הנתונים ותעבורת הרשת שאינטרנט הדברים יפיק דורש בדחיפות מעבר ממרכזי לדעתי אדריכלות מופצות, ואנחנו יודעים זאת אך לא בהכרח הבנו מה הפיתרון. כשאנחנו חושבים על הרעיון של האינטרנט של הדברים, זה מודל רשת בקנה מידה גדול. זה המון דברים שעושים עכשיו רעש. דברים שלא השמיעו רעש עד לא מזמן. ולמעשה, אני חושב שזה היה אתמול, דיברתי בבדיחות על הערימה, אבל הלכתי לקנות טוסטר חדש וזה הגיע עם אפשרות שיכולה לספר לי דברים שונים, כולל מתי היה צריך לנקות. ומיקרוגל חדש עם תכונה דומה מאוד ויכול היה אפילו ממש לצלצל אפליקציה בטלפון שלי כדי לומר שהדבר שחיממתי מחדש נעשה עכשיו. ואני מאוד סבורה שאם יש כמה דברים שאני לא רוצה לדבר איתי זה המקרר, המיקרוגל והטוסטר שלי. אני די נוח בכך שהם יהיו מכשירים מטומטמים. אבל יש לי מכונית חדשה לאחרונה, אאודי קטנה, והיא אכן מדברת איתי ואני די מרוצה מזה, כי הדברים שהיא מדברת עליהם הם דברים שמעניינים אותם. כמו לעדכן מפות בזמן אמת כדי לומר לי איפה יש דרך טובה יותר להגיע מנקודה A לנקודה B מכיוון שהיא מגלה תנועה דרך מנגנונים שונים עם נתונים שהיא נשלחת.
יש לי את השקופית הזו. כבר ראינו שדגמי הרשת בנפח גבוה דורשים מעבר ממרכז לתפיסה ומסירה מבוזרים של דגמי עיבוד נתונים ואנליטיקה. ראינו שהדברים זזים משלושת התרשימים הגרפים הקטנים שם בקצה הימני, שם ישנו, זה שמשמאל מתוך השלושה, ישנו דגם מרכזי עם כל המכשירים הקטנים מגיעים למיקום המרכזי אוספים נתונים והקנה המידה לא כל כך גדול, הם מתמודדים שם בסדר גמור. באמצע יש לנו מודל קצת יותר מבוזר ורכז ודיברנו, וזה מה שאני חושב שאנחנו צריכים עם האינטרנט של הדברים בדור הבא. ואז מצד ימין יש לנו את הרשת המפוזרת והרשתית המלאה הזו, שם האינטרנט של הדברים ומכונה למכונה הולך לעבור בטווח הקצר מאוד בעתיד, אבל אנחנו לא ממש שם ממגוון סיבות. ובעיקר מכיוון שאנו משתמשים בפלטפורמות אינטרנט עבור מרבית התקשורת עד כה ובאמת לא בנינו רשת שנייה שתוביל הרבה מהנתונים האלה.
ישנן רשתות שניות שקיימות כבר כמו רשת Batelco. הרבה אנשים לא חושבים על העובדה שרשתות הטלקום אינן אינטרנטיות. האינטרנט הוא דבר מאוד נפרד במובנים רבים. הם מנתבים נתונים מטלפונים חכמים דרך רשתות הטלפון, ואז דרך רשתות הטלפון והאינטרנט באופן כללי, שם הם בעצם מניחים אותם בשתי רשתות. אבל זה אפשרי לחלוטין וסביר להניח כי האינטרנט של הדברים יזדקק לרשת אחרת. אנו מדברים על האינטרנט התעשייתי כנושא באופן כללי, שלא נפרט אותו כעת, אך למעשה מדובר על רשת אחרת שתוכננה במיוחד לסוגי הובלה לנתונים או לאינטרנט של דברים ומכונה למכונה תקשורת.
אבל כמה מהדוגמאות שרציתי לחלוק בהן ראינו רשתות בנפח גבוה והפצת נתונים עובדות טוב מאוד הן דברים כמו האינטרנט. האינטרנט תוכנן במיוחד והועבר לארכיון מיום הראשון כדי להיות מסוגל לשרוד מלחמה גרעינית. אם חלקים של ארה"ב מפוצצים, האינטרנט תוכנן כך שהנתונים יוכלו לנוע באינטרנט ללא אובדן מנות מסיבות שאנחנו עדיין מחוברים. וזה קיים גם היום בקנה מידה עולמי. לאינטרנט יכולות מרובות סביב מנות יתירות וניתוב. ולמעשה האינטרנט נשלט על ידי דבר שנקרא BGP, פרוטוקול Border Gateway, ופרוטוקול Border Gateway, BGP, נועד במיוחד להתמודד עם נתב או מתג או שרת מושבתים. כשאתה שולח או מקבל דוא"ל, אם אתה שולח שלושה דוא"ל ברצף אין כל ערובה לכך שכל אחד מאותם דוא"ל ילך באותו מסלול לאותו יעד סיום. הם עשויים לעבור דרך חלקים שונים באינטרנט מסיבות שונות. יכול להיות הפסקת חשמל, יכול להיות שיש חלונות תחזוקה שבהם דברים לא מקוונים יש לשדרג, יכול להיות פשוט עומס ברשת, ואנחנו רואים שדברים כמו רשתות תנועה עם מכוניות ותחבורה ציבורית ואוניות ומטוסים. אנו מקבלים תוכן למכשירים שלנו כמו מחשבים ניידים וטאבלטים ומחשבים דרך הדפדפנים וכדומה כל יום דרך רשתות למסירת תוכן. רשתות מסירת תוכן עוסקות בהעתקת עותקים של תוכן מפלטפורמת ההגשה הראשית שלך, כגון שרת האינטרנט והעברת עותקים של זה והמטמון כמויות קטנות עד קצה הרשת ורק מסירתו אליך מהחלק הקרוב ביותר של הקצה.
אנטי ספאם ואבטחת סייבר - אם אירוע ספאם מתרחש בקנדה ומיקרוסופט מזהה אותו ורואה שיש המון עותקים של אותו אימייל שנשלחים לקבוצה של אנשים אקראיים, נלקחים בדיקות בדיקה על זה, חתימה להודעה זו היא נוצר והכניס לרשת והופץ מייד. וכך דוא"ל אף פעם לא נכנס לתיבת הדואר הנכנס שלי, או אם כן, הוא מתויג כדואר זבל מייד מכיוון שהוא התגלה במקום אחר בקצה הרשת. וכך מספרים על חלקים אחרים בקצה הרשת על חתימת הודעת הספאם הזו והיא מכניסת לאינדקס של מסד נתונים ואם ההודעות הללו מתחילות להופיע בצד השני של כדור הארץ, אנו מזהים אותן ואנחנו יודעים שהן זבל. והוא הדין לביטחון הסייבר. גרזן שמתרחש בצד אחד של כדור הארץ מתגלה ונרשם וממופה ופתאום בחלק השני של הרשת אנו יכולים להילחם בו ולהגיש את הכללים והמדיניות ולשנות אם נוכל לחסום אותו. במיוחד עם ההשפעה החדשה של דברים כמו מניעת שירות או שלילת שירות מבוזרת בה משתמשים באלפי מכונות כדי לתקוף אתר מרכזי.
ביטקוין והבלוקצ'יין, הם כברירת מחדל, באופיים הוא ספר גדול מבוזר, הבלוקצ'יין ומתמודד עם כל הפסקות או שברים ברשת. איתור ומניעת הונאה, שירותי חשמל ומים - אנו רואים, אתם מכירים את רשת הכוח, אם חלק אחד מהרשת מקבל עליו עץ אדמה ומוציא עמוד וחוט, הבית שלי עדיין מקבל כוח. אני אפילו לא יודע על זה, לעתים קרובות אני אפילו לא רואה את זה בחדשות. וכולנו רגילים לרשתות התחבורה שבמקור היה מודל ריכוזי, "כל הדרכים הובילו לרומא", כמו שאומרים, ואז בסופו של דבר היינו צריכים ללכת למודל המבוזר עם רכזות וחישורים, ואז הלכנו לרשת מרושתת בה תוכלו להגיע מצד אחד של העיר לצד השני דרך נתיבי רשת שונים וצמתים שונים. וכך מה שאנחנו רואים כאן הוא שהמודל הריכוזי הזה של מה שאנחנו עושים עכשיו עם האינטרנט של הדברים יצטרך לדחוף אל קצה הרשת. וזה תקף לניתוח יותר מתמיד, וזה שאנחנו צריכים לדחוף את האנליטיקס לרשת. וכדי לעשות זאת זה דורש גישה חדשה לחלוטין באופן שבו אנו ניגשים לעיבוד של אותם נתונים וזרמי הנתונים, בעיניי. אנו מדברים כעת על תרחיש בו אני מאמין שאנחנו רואים אינטליגנציה מוגבלת שנדחפת אל קצה הרשת במכשירים המחוברים לאינטרנט, אך בקרוב אנו הולכים לראות את המכשירים האלה עולה באינטליגנציה ומעלים את רמת הניתוח שהם רוצים לעשות. וכתוצאה מכך אנו נצטרך לדחוף את החכמים האלה יותר ויותר דרך הרשת.
לדוגמה, אפליקציות חכמות ומדיה חברתית - אם אנחנו חושבים על מדיה חברתית וחלק מהאפליקציות החכמות, הם עדיין מאוד מרכזיים. אתה יודע, יש רק שניים או שלושה מרכזי נתונים לאוהבי הפייסבוק. גוגל הפכה מבוזרת הרבה יותר, אך עדיין יש מספר מוגבל של מרכזי נתונים ברחבי העולם. ואז כשאנחנו חושבים על התאמה אישית של תוכן, אתה צריך לחשוב ברמה המקומית ביותר. הרבה מזה נעשה בדפדפן שלך או בשכבת רשת מקומית לאספקת תוכן. ואנחנו חושבים על עוקבי בריאות וכושר - הרבה מהנתונים שנאספים מהם נותחים באופן מקומי וכך הגרסאות החדשות של מכשירי Garmin ו- Fitbit ששמת על פרק כף היד שלך, הן הופכות לחכמות וחכמות יותר במכשיר. . כעת הם לא שולחים את כל הנתונים אודות הדופק שלך לשרת מרכזי כדי לנסות לבצע את הניתוח; הם בונים את המודיעין הזה ישירות למכשיר. ניווט ברכב היה אמור להיות שהמכונית כל הזמן תקבל עדכונים ומפות ממיקום מרכזי, כעת החכמים נמצאים ברכב וההחלטות של המכונית לגמרי לבד ובסופו של דבר המכוניות יתפרסו. המכוניות ידברו זו עם זו דרך רשתות אלחוטיות מסוג כלשהו, שעשויות להיות מעל 3G או רשת אלחוטית 4G בדור הבא, אך בסופו של דבר זה יהיה מכשיר למכשיר. והדרך היחידה בה אנו מתמודדים עם הנפח של זה היא על ידי הפיכת המכשירים לחכמים יותר.
יש לנו כבר מערכות אזהרת חירום שתאסוף מידע באופן מקומי ותשלח אותו באופן מרכזי או לרשת רשת ותקבל החלטות לגבי המתרחש באופן מקומי. לדוגמה, ביפן יש יישומים שאנשים מפעילים בסמארטפונים שלהם עם מדי תאוצה בסמארטפון. מדי האצה בסמארטפון יזהו רטט ותנועה ויכולים לקבוע את ההבדל בין תנועה יומיומית רגילה לבין הרעידות והזעזועים של רעידת אדמה. והטלפון ההוא יתחיל להתריע מייד, מקומית. האפליקציה בפועל יודעת שהיא מגלה רעידות אדמה. אבל זה גם משתף נתונים אלה דרך רשת במוקד מבוזר ומדבר כך שאנשים בסביבתך מתריעים מייד או בהקדם האפשרי מפני שהנתונים זורמים דרך הרשת. ואז בסופו של דבר כשמדובר במיקום מרכזי או בעותק מבוזר של המיקום המרכזי הוא דוחף חזרה לאנשים שאינם באזור המיידי, לא גילו את תנועת הכוכב, אך צריך להזהיר אותו מכיוון ש אולי צונאמי מגיע.
ותשתית עיר חכמה - מושג התשתית החכמה, אנחנו כבר בונים את השכל למבנים חכמים ותשתיות חכמות. למעשה, אתמול החניתי את מכוני בעיר באזור חדש בו חלק מהעיר משופצת ונבנית מחדש. והם עשו מחדש את כל הרחובות, ויש חיישנים ברחובות, ומד החנייה בפועל יודע שכשנסעתי עם מכונית, הוא יודע שכשאני הולך לרענן את הגבול של שעתיים, המכונית לא זזה, והיא לא הייתה מאפשרת לי להתמלא ולהישאר עוד שעתיים. הייתי צריך להיכנס למכונית, להוציא את החלל ואז לחזור פנימה כדי להערים עליה כדי לאפשר לי להישאר שם עוד שעתיים. אבל מה שמעניין הוא שבסופו של דבר אנו עוברים לנקודה בה זה לא רק מגלה את המכונית שנכנסת לאזור כחיישן מקומי, אלא דברים כמו מאפיינים אופטיים שבהם תוחל זיהוי עם מצלמות שמסתכלות על לוחית הרישוי שלי, והיא תדע שלמעשה פשוט שלפתי וחזרתי פנימה והערכתי בזה, וזה פשוט לא יאפשר לי להתחדש ואמשיך הלאה. ואז הוא יפיץ את הנתונים הזה ויוודא שאינני יכול לעשות זאת בשום מקום אחר ולהערים על הרשת באופן שוטף. מכיוון שהוא צריך, מטבעו, להיות חכם יותר, אחרת נמשיך לשטות בזה.
יש דוגמה לכך שבעצם חייתי באופן אישי איפה שטכנולוגיית חומת האש, בסוף שנות ה -80 ותחילת שנות ה -90, מוצר בשם צ'ק פוינט FireWall-1. טכנולוגיית חומת אש מאוד פשוטה שהשתמשנו בה כדי ליצור כללים ולבנות מדיניות וכללים סביב דברים מסוימים לומר כי סוגי תנועה דרך יציאות וכתובות IP מסוימות ורשתות להגיע אחד לשני, התעבורה באינטרנט ממקום למקום, עוברים מסוף הדפדפן והלקוח לסוף השרת שלנו. פתרנו את הבעיה על ידי הוצאת הלוגיקה ממש מחומת האש עצמן והעברת אותה למעשה ל- ASIC, המעגל המשולב הספציפי ליישום. זה היה שליטה על היציאות במתגי Ethernet. גילינו שמחשבי השרת, המחשבים בהם השתמשנו למעשה כשרתים בכדי לקבל החלטות כחומות אש, לא היו מספיק עוצמתיים כדי להתמודד עם נפח התעבורה שעובר עליהם לכל בדיקת מנות קטנה. פתרנו את הבעיה על ידי העברת ההיגיון הדרוש לביצוע בדיקת מנות וגילוי אינטרנט למתגי הרשת שהופצו ומסוגלים להתמודד עם נפח הנתונים העוברים ברמת הרשת. לא דאגנו לזה ברמה ריכוזית עם חומות אש, העברנו את זה למתגים.
וכך היינו שהיצרנים בונים את היכולת לנו לדחוף שבילים וכללים ומדיניות למתג ה- Ethernet כך שברמת יציאת ה- Ethernet בפועל, ואולי הרבה אנשים בבריכה אינם מכירים את זה מכיוון שאנחנו כולם חיים בעולם אלחוטי עכשיו, אבל פעם היה הכל צריך להתחבר דרך Ethernet. כעת ברמת יציאת אתרנט, בדקנו מנות כדי לבדוק האם מנות אפילו למנות לעבור למתג ולרשת. חלק מהדברים שאנו פותרים כעת סביב האתגר הזה של לכידת נתונים ברשת, ספציפית ממכשירי ה- IRT, ובחינתם וביצוע ניתוחים עליו וכנראה ניתוחים עליו בזמן אמת לקבל החלטות עליו. וחלק מכך כדי לקבל תובנות במודיעין עסקי ובמידע כיצד בני האדם מקבלים החלטות טובות יותר וניתוחים וביצועים אחרים לגבי הדברים שמכונה למכונה בהם מכשירים מדברים עם מכשירים ומקבלים החלטות.
וזה הולך להיות טרנד שעלינו להסתכל עליו לפתור בעתיד המיידי כי אם לא, אנחנו פשוט נגמר עם מבול הרעש הזה. וראינו בעולם הנתונים הגדול, ראינו שדמיוני אגמים נתונים הופכים לביצות נתונים שבסופו של דבר אנו מוצאים מבול של רעש שלא מצאנו כיצד לפתור את ניתוח העיבוד עבורו במרכז אופנה. אם לא נפתור את הבעיה הזו, לדעתי, עם ה- IoT מייד ונשיג פיתרון פלטפורמה מהר מאוד, אנו עומדים בסופו של דבר במקום מאוד רע.
ועם זה בראש אני הולך לסגור את הנקודה שלי שהיא שאני מאמין שאחד השינויים הגדולים ביותר שמתרחשים כיום בתחום ה- Big Data והאנליטיקס מונע על ידי הצורך המיידי להגיב להשפעת האינטרנט של דברים בניתוחים אנליטיים בזמן אמת ובזמן אמת, בכך שאנחנו צריכים להעביר את האנליטיקס לרשת ואז בסופו של דבר לקצה הרשת רק כדי להתמודד עם הנפח העצום שלה, רק כדי לעבד אותה. ואז בסופו של דבר, אני מקווה, מכניסים את האינטליגנציה לרשת ושולי הרשת במודל רכזת ודיבור, שנוכל ממש לנהל אותה ולקבל תובנות בזמן אמת ולקבל ממנו ערך. ועם זה אני הולך לעבור לאורח שלנו ולראות לאן השיחה הזו לוקחת אותנו.
שון רוג'רס: תודה רבה. זהו שון רוג'רס מדל סטטיסטיקה של Dell, וילד, רק מלכתחילה, אני מסכים לחלוטין עם כל הנושאים המרכזיים בהם נגעו כאן. ורבקה, התחלת עם אחד סביב הרעיון של, אתה יודע, הנתונים האלה אינם חדשים, וזה מדהים בעיניי כמה זמן ואנרגיה מוציאים לדיון בנתונים, בנתונים, בנתונים של ה- IoT. וזה בהחלט רלוונטי, אתה יודע, רובין עשה נקודה טובה, גם אם אתה עושה משהו ממש פשוט ואתה מכניס לתרמוסטט פעם בשנייה, אתה יודע שאתה עושה את זה 24 שעות ביממה ולמעשה יש לך אתה יודע, כמה אתגרי נתונים מעניינים. אבל, אתה יודע, בסופו של דבר - ואני חושב שהרבה אנשים בענף מדברים על הנתונים בצורה כזו - שזה לא כל כך מעניין ולדבריה של רבקה, זה היה הרבה זמן טוב, אבל בעבר לא הצלחנו לעשות בו שימוש רב. ואני חושב שתעשיית האנליטיקה המתקדמת ותעשיית ה- BI בכלל מתחילים להפנות את ראשם לכיוון IoT. ודז, לנקודה הסופית שלך, זה היותך חלק מנקודות המאתגר של נוף הנתונים הגדולים או אחת מהן, אני חושב שזה נכון מאוד. אני חושב שכולם נרגשים מאוד מה אנו יכולים לעשות עם סוג זה של נתונים, אך יחד עם זאת, אם לא נוכל להבין כיצד ליישם תובנות, לנקוט בפעולה, ואתה יודע, לקבל ניתוחים היכן הנתונים נמצאים, אני חושב עומדים בפנינו אתגרים שאנשים לא רואים שהם באמת הולכים בדרכם.
עם זאת, במרחב האנליטיקס המתקדם אנו מעריצים גדולים של מה שאנו חושבים שיכול לקרות עם נתוני IoT, במיוחד אם אנו מיישמים זאת על ניתוח. ויש הרבה מידע על השקופית הזו ואני אתן לכולם פשוט לצוד ולנקר מסביב, אבל אם אתה מסתכל על מגזרים שונים כמו קמעונאות בצד הימני, הוא רואה את ההזדמנות שלהם שמתעוררת סביב היכולת להיות חדשניים יותר או שיש להם כמה חיסכון בעלויות או אופטימיזציה או שיפורים בתהליך הוא חשוב מאוד והם רואים מקרי שימוש רבים לצורך כך. אם אתה מסתכל, אתה יודע, משמאל לימין לרוחב השקופית, אתה תראה כיצד כל אחד מהתעשיות הבודדות הללו תובע יכולות חדשות והבדל הזדמנויות שונות לעצמן כאשר הם מיישמים ניתוח ל- IoT. ואני חושב שבשורה התחתונה, אם אתה מתאמץ לרדת בדרך זו אתה צריך לא רק לדאוג לנתונים, כפי שדיברנו עליהם, והארכיטקטורה, אלא שאתה צריך לבדוק איך הכי טוב לעשות להחיל את הניתוח עליו ובמקום בו צריך לבצע את הניתוח.
עבור רבים מאיתנו בשיחת היום, אתם יודעים, רובין ואני מכירים זה את זה הרבה זמן וניהלנו אינספור שיחות על ארכיטקטורות מסורתיות בעבר, אלה סביב מאגרי מידע מרכזיים או מחסני נתונים ארגוניים וכן הלאה, וכמו שאנחנו ' מצאנו בעשור האחרון בערך אנו עושים עבודה טובה למדי למתוח את המגבלות של אותן תשתיות. והם לא יציבים או חזקים כמו שהיינו רוצים שיהיו היום כדי לתמוך בכל האנליטיקה הנהדרת שאנו מיישמים למידע וכמובן שהמידע גם שובר את הארכיטקטורה, אתה יודע, מהירות הנתונים, נפח הנתונים וכן הלאה, בהחלט מותחים את המגבלות של כמה מהגישות והאסטרטגיות המסורתיות יותר שלנו לעבודה מסוג זה. ולכן אני חושב שזה מתחיל לדרוש את הצורך של חברות לנקוט בעמדה זריזה ואולי גמישה יותר של זה וזה החלק, אני מניח שהייתי רוצה לדבר על קצת בצד ה- IoT.
לפני שאעשה זאת אקח רגע רק לתת לכל מי שמתקשר, לתת לך קצת רקע על מה זה סטטיסטיקה ומה אנחנו עושים. כפי שאתה יכול לראות בכותרת של שקופית זו, סטטיסטיקה היא ניתוח ניבוי, נתונים גדולים ויזואליזציה לפלטפורמת IoT. המוצר עצמו בן קצת יותר משלושים שנה ואנחנו מתחרים עם המובילים האחרים בשוק שאתה בוודאי מכיר בקווי יכולת ליישם ניתוח חזוי, ניתוח מתקדם על נתונים. ראינו הזדמנות להרחיב את טווח ההגעה למקום בו אנו מכניסים את הניתוח שלנו והתחלנו לעבוד על כמה טכנולוגיות זמן מה אחרון שמיקמו אותנו למדי כדי לנצל את מה שדיז וגם רובין דיברו עליו היום, זו גישה חדשה זו איפה אתה הולך לשים את הניתוח וכיצד אתה מתמזג עם הנתונים. לאורך הצד הזה מגיעים דברים אחרים שצריך להתמודד איתם עם הפלטפורמה, וכפי שציינתי, סטטיסטיקה הייתה בשוק הרבה זמן. אנו טובים מאוד בצד המיזוג בין הדברים, ולדעתי, אתה יודע, לא דיברנו יותר מדי על גישה לנתונים כיום, אלא ביכולתנו להגיע לרשתות המגוונות הללו ולקבל ידיים על הנתונים הנכונים באתר הזמן הנכון הופך להיות יותר ויותר מעניין וחשוב עבור משתמשי הקצה.
לבסוף אעיר כאן קטע נוסף, מכיוון שדז הצביעה היטב על הרשתות עצמן, שיש להן מידה מסוימת של שליטה וביטחון על מודלים אנליטיים בסביבתך וכיצד הם מצמידים עצמם לנתונים הופכים חשובים מאוד. כשנכנסתי לתעשייה הזו לפני כמה שנים - כמעט 20 לדעתי בנקודה זו - כשדיברנו על ניתוחים מתקדמים, זה היה בצורה מאוד אצרטית. רק זוג אנשים בארגון התייחסו אליו, הם פרשו אותה והם נתנו לאנשים את התשובה כנדרש או סיפקו תובנות כנדרש. זה באמת משתנה ומה שאנחנו רואים זה הרבה אנשים שעבדו עם דרך אחת או יותר מגוונת וגמישה יותר להגיע לנתונים, ליישם אבטחה ומשילות על הנתונים ואז להיות מסוגלים לשתף פעולה בזה. אלה הם כמה מהדברים החשובים ש- Dell Statistica מסתכל עליהם.
אבל אני רוצה לצלול לנושא שקצת קרוב יותר לכותרת של ימינו, כיצד עלינו להתייחס לנתונים שמגיעים מהאינטרנט של הדברים ולמה שאולי תרצה לחפש כשאתה בוחן פתרונות שונים. השקופית שקמתי לפניך כרגע היא סוג של נוף מסורתי ושניהם דז 'ורובין די נגעו בזה, אתה יודע, הרעיון הזה של לדבר עם חיישן, בין אם זה רכב או טוסטר או טורבינת רוח, או מה יש לך, ואז העברת נתונים ממקור הנתונים לרשת שלך בחזרה לסוג תצורה מרכזי, כפי שציין דז. והיא פועלת בצורה די טובה והרבה חברות נכנסות לחלל ה- IoT במקור מתחילות לעשות את זה עם הדגם הזה.
הדבר הנוסף שהגיע, אם אתה מסתכל לעבר החלק התחתון של השקופית, הוא הרעיון הזה לקחת מקורות נתונים מסורתיים אחרים, להגדיל את נתוני ה- IoT שלך ואז ליבה מסוג זה, בין אם הגרעין שלך הוא מרכז נתונים או זה יכול להיות בענן, זה לא ממש משנה, היית לוקח מוצר כמו סטטיסטיקה ואז מיישם עליו אנליטיקה באותה נקודה ואז מספק את התובנות הללו לצרכנים מצד ימין. ואני חושב שזו הימור הטבלה בנקודה זו. זה משהו שאתה צריך להיות מסוגל לעשות ואתה צריך להיות ארכיטקטורה מספיק פתוחה לפלטפורמת ניתוח מתקדמת ולדבר עם כל אלה, מקורות נתונים מעין, מגוונים, כל החיישנים האלה וכל היעדים השונים האלה שבהם יש לך את הנתונים. ואני חושב שזה משהו שאתה צריך להיות מסוגל לעשות ואני חושב שתמצא שזה נכון שהרבה מנהיגים בשוק מסוגלים לעשות דברים מסוג זה. כאן בסטטיסטיקה מדברים על זה כניתוח ליבה. לכו להביא את הנתונים, החזירו את הנתונים לליבה, עבדו אותם, הוסיפו נתונים נוספים במידת הצורך או אם יתרון, עשו את הניתוח שלכם ואז שתפו את המידע הזה לפעולה או לתובנה.
ולכן אני חושב שאלו בהחלט מבחינה פונקציונלית, כנראה שכולנו מסכימים שידוע לך שזה הכרח היחיד וכולם צריכים לעשות זאת. איפה שזה מתחיל להיות די מעניין הוא המקום בו יש לך כמויות אדירות של נתונים, אתה יודע, שמקורם במקורות נתונים מגוונים, כמו חיישני IoT, כפי שציינתי, בין אם מדובר במכונית או במצלמת אבטחה או בתהליך ייצור, שם מתחיל להיות יתרון בכך שהוא מסוגל לבצע את הניתוח במקום בו הנתונים באמת מופקים. והיתרון לרוב האנשים, לדעתי, כשנתחיל להעביר את האנליטי מהליבה החוצה אל הקצה הוא היכולת הזו להפיץ כמה מאתגרי הנתונים שקורים, ודז ורובין בטח יגיבו על כך בסוף היום, אבל אני חושב שאתה צריך להיות מסוגל לפקח ולנקוט בפעולות בנושא נתונים בקצה כך שלא תמיד יש צורך להעביר את כל הנתונים לרשת שלך. רובין דיבר על כך בתמונות האדריכלות שלו, שהוא סוג של, שם יש לך את כל המקורות השונים האלה, אבל בדרך כלל יש איזו נקודת צבירה. נקודת הצבירה שאנו רואים לעתים קרובות למדי היא או ברמת חיישן, אך לעיתים קרובות יותר ברמת שער. ושערים אלה מתקיימים כמתווך בזרימת הנתונים ממקורות הנתונים לפני שאתה חוזר לליבה.
אחת ההזדמנויות בהן ניצל Dell Statistica היא היכולת שלנו לייצא דגם מפלטפורמת האנליטיקס המתקדמת והריכוז שלנו בכדי להיות מסוגלים לקחת מודל ואז לבצע את הדגם הזה בקצה פלטפורמה אחרת, כמו שער או בפנים. של מסד נתונים, או מה יש לך. ואני חושב שהגמישות שנותנת לנו היא מה באמת הנקודה המעניינת בשיחה של היום, האם יש לך את זה בתשתית שלך היום? האם אתה מסוגל להעביר אנליטי למקום בו הנתונים חיים לעומת פשוט תמיד להעביר את הנתונים למקום בו האנליטיקה שלך גרה? וזה משהו שסטטיסטיקה מתמקדת בו די הרבה זמן, וכשאתה מסתכל מקרוב על השקופיות תראה שיש שם קצת טכנולוגיה אחרת של חברת האחות שלנו, Dell Boomi. Dell Boomi היא פלטפורמת שילוב נתונים ושילוב יישומים בענן ואנחנו למעשה משתמשים ב- Dell Boomi כמכשיר סחר בכדי להעביר את הדגמים שלנו מדל סטטיסטיקה של Dell, דרך Boomi ומכשירים מקדימים. ואנחנו חושבים שזו גישה זריזה שחברות הולכות לדרוש, ככל שהם אוהבים את הגרסה שהראיתי לכם לפני דקה, שהיא סוג הרעיון המרכזי של העברת נתונים מהחיישנים כל הדרך חזרה אל מרכז, באותו זמן חברות הולכות לרצות להיות מסוגלות לעשות את זה כמו שאני מתווה כאן. והיתרונות לעשות זאת הם בכמה מהנקודות שהן גם רובין וגם דז עשו, כלומר האם אתה יכול לקבל החלטה ולנקוט בפעולה במהירות העסק שלך? האם אתה יכול להעביר ניתוחים ממקום למקום ולהיות מסוגל לחסוך לעצמך את הזמן, הכסף והאנרגיה והמורכבות של העברת כל העת של נתוני קצה אלה לליבה.
עכשיו אני הראשון שאומר שחלק מנתוני הקצה תמיד יהיו בעלי יכולת גבוהה מספיק במקום בו יהיה זה הגיוני לאחסן נתונים אלה ולשמור אותם ולהחזיר אותם לרשת שלך, אבל איזה ניתוח קצה יאפשר לך האם היכולת לקבל החלטות במהירות שהנתונים מגיעים אליהם, נכון? שאתה מסוגל ליישם את התובנה והפעולה במהירות שבה הערך הגבוה ביותר אפשרי. ואני חושב שזה משהו שכולנו נחפש כשמדובר בשימוש באנליטיקה מתקדמת ונתוני IoT זו ההזדמנות הזו לנוע במהירות העסק או במהירות שהלקוח דורש. אני חושב שעמדתנו היא שאני חושב שאתה צריך לעשות את שניהם. ואני חושב שדי מהר ובמהירות רבה ככל שיותר חברות בוחנות מערכי נתונים מגוונים יותר, במיוחד אלה מהצד IoT, הם יתחילו להסתכל על שטח הספק ולדרוש מה יכולת הסטטיסטיקה לעשות. כלומר לפרוס מודל בליבה, כפי שעשינו באופן מסורתי במשך שנים רבות, או לפרוס אותו בפלטפורמות שאולי אולי לא מוסכמות, כמו שער IoT, ולמעשה להיות מסוגלים לקלוע ולהחיל אנליטיקס על הנתונים בקצה ככל שהנתונים מופקים. ואני חושב שכאן נכנס החלק המרגש בשיחה זו. מכיוון שהיכולת ליישם אנליטי בקצה בזמן שהנתונים יוצאים מחיישן, מאפשרת לנו לנקוט בפעולה הכי מהר שאנחנו צריכים, אך גם מאפשר לנו להחליט, האם נתונים אלה צריכים לחזור מייד אל הגרעין? האם נוכל להעביר אותו לכאן ואז להחזיר אותו לחלקים וחלקים ולעשות ניתוח נוסף בהמשך? וזה מה שאנחנו רואים שהרבה מהלקוחות המובילים שלנו עושים.
הדרך בה Dell Statistica עושה זאת היא שיש לנו יכולת להשתמש, אז נניח למשל שאתה בונה רשת עצבית בתוך סטטיסטיקה ורצית להציב את הרשת העצבית במקום אחר בנוף הנתונים שלך. יש לנו את היכולת להציג את הדגמים ואת כל השפות ששמת לב בפינה הימנית שם - Java, PPML, C ו- SQL וכן הלאה, אנו כוללים גם את פייתון ואנחנו יכולים גם לייצא את הסקריפטים שלנו - וכשאתה מעביר את זה מהפלטפורמה שלנו שהיא מרכזית, אתה יכול לפרוס את הדגם או האלגוריתם הזה בכל מקום שאתה צריך אותו. וכפי שציינתי קודם, אנו משתמשים ב- Dell Boomi כדי למקם אותם ולחנות אותם במקום שאנחנו צריכים להפעיל אותם ואז נוכל להחזיר את התוצאות, או שאנחנו יכולים לעזור להחזיר נתונים, או לקלוע את הנתונים ולנקוט בפעולה תוך שימוש במנוע הכללים שלנו . כל הדברים האלה הופכים להיות חשובים כשאנחנו מתחילים לבחון סוג זה של נתונים ואנחנו חושבים שוב.
זה משהו שלרובכם בטלפון יהיה צורך לעשות מכיוון שזה יהפוך ליקר מאוד ומיסוי על הרשת שלכם, כמו שציין דז, להעביר נתונים משמאל לתרשימים אלה מימין לתרשימים האלה. זמן. זה לא נשמע כמו הרבה אבל ראינו לקוחות מייצרים עם עשרת אלפים חיישנים במפעלים שלהם. ואם יש לך עשרת אלפים חיישנים במפעל שלך, אפילו אם אתה פשוט עושה את זה בסוג שני של בדיקות או איתותים, אתה מדבר על שמונים וארבע אלף שורות נתונים מכל אחד מאותם חיישנים בודדים ביום. וכך הנתונים בהחלט נערמים ורובין הזכיר את זה. לפני כן ציינתי כמה תעשיות בהן אנו רואים שאנשים עושים כמה דברים מעניינים למדי בעזרת התוכנה ונתוני IoT: בניית אוטומציה, אנרגיה, כלי עזר זה חלל חשוב באמת. אנו רואים עבודה רבה במיטוב מערכות, אפילו שירות לקוחות וכמובן תפעול ותחזוקה כוללים, במתקני אנרגיה ובתוך בנייה לאוטומציה. ואלה כמה מקרי שימוש שאנו רואים שהם די חזקים.
עשינו ניתוח קצה בעבר, אני מניח שהמונח נטבע. כפי שציינתי, יש לנו שורשים עמוקים בסטטיסטיקה. החברה הוקמה לפני קרוב לשלושים שנה ולכן יש לנו לקוחות לחזור לא מעט זמן שמשלבים נתוני IoT עם הניתוח שלהם ונמשכים זמן מה. ו- Alliant Energy הוא אחד ממקרי השימוש או לקוחות הפניה שלנו. ואתה יכול לדמיין את הבעיה שיש לחברת אנרגיה עם מפעל פיזי. קנה המידה מעבר לקירות הלבנים של מפעל פיזי קשה ולכן חברות אנרגיה כמו אליאנט מחפשות דרכים לייעל את תפוקת האנרגיה שלהן, בעצם לשפר את תהליך הייצור שלהן ולייעל אותה לרמה הגבוהה ביותר. והם משתמשים בסטטיסטיקה כדי לנהל את הכבשן בתוך הצמחים שלהם. ולכולנו שחוזרים לימינו הראשונים בכיתת המדע, כולנו יודעים שהתנורים מייצרים חום, החום גורם לאדים, הטורבינות מסתובבות, אנחנו מקבלים חשמל. הבעיה עבור חברות כמו אליאנט היא למעשה מיטוב כיצד הדברים מתחממים ונשרפים בתוך תנורי הציקלון הגדולים הללו. ומיטוב התפוקה כדי להימנע מעלויות נוספות של זיהום, עקירת פחמן וכן הלאה. וכך עליכם להיות מסוגלים לפקח על החלק הפנימי של אחד מתנורי הציקלון הללו עם כל המכשירים, החיישנים הללו ואז לקחת את כל נתוני החיישנים הללו ולבצע שינויים בתהליך האנרגיה באופן שוטף. וזה בדיוק מה שסטטיסטיקה עשתה עבור אליאנט מאז בערך 2007, לפני שאפילו המונח IoT היה פופולרי במיוחד.
לנקודה של רבקה בשלב מוקדם, הנתונים בהחלט לא חדשים. היכולת לעבד אותו ולהשתמש בו נכון היא באמת המקום בו הדברים המרגשים קורים. דיברנו קצת על שירותי בריאות בשיחה מוקדמת היום ואנחנו רואים כל מיני יישומים עבור אנשים שיעשו דברים כמו טיפול טוב יותר בחולים, תחזוקה מונעת, ניהול שרשרת אספקה ויעילות תפעולית בתחום הבריאות. וזה די מתמשך ויש הרבה מקרי שימוש שונים. אחד שאנחנו מאוד גאים בו בסטטיסטיקה הוא עם הלקוחות שלנו Shire Biopharmaceuticals. ושייר מייצרת תרופות מיוחדות למחלות שקשה מאוד לטפל בהן. וכאשר הם יוצרים אצווה של תרופות עבור הלקוחות שלהם, זהו תהליך יקר במיוחד ואותו תהליך יקר במיוחד לוקח גם זמן. כשאתה חושב על תהליך ייצור כפי שאתה רואה שהאתגרים הם איחוד בכל הנתונים, גמישות מספיק בכל מיני דרכים להכניס נתונים למערכת, אימות המידע ואז היכולת לחזות כיצד אנו עוזרים ללקוח. והתהליכים ששכו את רוב המידע ממערכות הייצור שלנו וכמובן מהמכשירים והחיישנים המניעים את מערכות הייצור הללו. וזה מקרה שימוש נהדר לאופן בו חברות נמנעות מהפסד ומייעל את תהליכי הייצור שלהן באמצעות שילוב של נתוני חיישנים, נתוני IoT ונתונים רגילים מהתהליכים שלהם.
אז אתה יודע, דוגמה טובה למקום בו הייצור, ובעיקר ייצור היי-טק, מועילים לתעשיית שירותי הבריאות סביב סוג זה של עבודה ונתונים. אני חושב שיש לי רק עוד כמה נקודות שהייתי רוצה להעלות לפני שאמציא את זה ואחזיר אותה לדז 'ורובין. אבל אתה יודע, אני חושב שהרעיון הזה של היכולת לדחוף את האנליטי שלך לכל מקום בסביבה שלך הוא משהו שהולך להיות חשוב ביותר עבור רוב החברות. להיות קשור לפורמט המסורתי של נתוני ETL ממקורות חזרה למיקומים מרכזיים תמיד יהיה מקום באסטרטגיה שלך, אך זה לא אמור להיות האסטרטגיה היחידה שלך. אתה צריך לנקוט בגישה הרבה יותר גמישה לדברים כיום. כדי ליישם את האבטחה שציינתי, הימנע ממיסוי הרשת שלך, כדי להיות מסוגל לנהל ולסנן את הנתונים כשהם מגיעים מהקצה, ולקבוע אילו נתונים כדאי לשמור לטווח הארוך, אילו נתונים שווה לעבור לרשת שלנו, או אילו נתונים פשוט צריכים לנתח בזמן שהם נוצרים, כדי שנוכל לקבל את ההחלטות הטובות ביותר. גישה אנליטית זו בכל מקום ובכל מקום היא משהו שאנחנו לוקחים די בלב בסטטיסטיקה וזה משהו שאנחנו מאוד בקיאים בו. וזה חוזר לאחת השקופיות שציינתי קודם, היכולת לייצא את הדגמים שלך במגוון שפות, כך שתוכל להתאים ולהתאים קו עם הפלטפורמות בהן נוצרים הנתונים. ואז כמובן שיש מכשיר הפצה עבור אותם דגמים וזה גם משהו שאנחנו מביאים לשולחן ושאנחנו מאוד מתלהבים ממנו. אני חושב שהשיחה היום היא שאם אנו באמת הולכים להתייחס לרצינות בנתונים האלה שהיו במערכת שלנו הרבה זמן והיינו רוצים למצוא יתרון תחרותי וזווית חדשנית כדי להשתמש בהם, עליכם ליישם קצת טכנולוגיה שמאפשרת לכם להתרחק מכמה מאותם דגמים מגבילים בהם השתמשנו בעבר.
שוב, הנקודה שלי היא שאם אתה מתכוון לעשות IoT, אני חושב שאתה צריך להיות מסוגל לעשות את זה בליבה, ולהביא את הנתונים ולהתאים אותם לנתונים אחרים ולעשות את הניתוחים שלך. אך בנוסף, חשוב לא פחות או אולי חשוב אף יותר, עליכם להיות בעלי גמישות זו בכדי להציב את האנליטי עם הנתונים ולהעביר את האנליטי מהצד המרכזי של הארכיטקטורה שלכם אל הקצה לטובת היתרונות שציינתי. לפני. זה קצת קשור למי שאנחנו ומה שאנחנו עושים בשוק. ואנחנו מאוד נרגשים מ- IoT, אנו חושבים שזה בהחלט מגיע לגיל ויש הזדמנויות נהדרות לכולם כאן להשפיע על האנליטיקה והתהליכים הקריטיים שלהם עם סוג זה של נתונים.
רבקה יוז'ויאק: שון, תודה רבה, זו הייתה מצגת ממש פנטסטית. ואני יודע שדז כנראה מת לשאול אותך כמה שאלות אז דז, אני אתן לך ללכת קודם.
דז בלנשפילד: יש לי מיליון שאלות אבל אני אכיל את עצמי כי אני יודע שגם לרובין יהיה. אחד הדברים שאני רואה למרחקים הוא שאלה שעולה ואני ממש להוט לקבל קצת תובנות על החוויה שלך בהתחשב בזה שאתה צודק בלב העניינים. ארגונים נאבקים עם האתגר ונראה שחלקם קראו בדיוק כמו "המהפכה התעשייתית הרביעית" של קלאוס שוואב ואז עברו התקף חרדה. ואלה שלא מכירים את הספר הזה, זה בעצם תובנה של רבותיי, מאת קלאוס שוואב, שלדעתי הוא פרופסור, שהוא המייסד והיו"ר המנהל של הפורום הכלכלי העולמי מהזיכרון, והספר בעיקרו כל האינטרנט הזה של דברים התפוצצות וכמה מההשפעה על העולם בכלל. ארגונים איתם אני מדבר אינם בטוחים אם עליהם ללכת ולהשתמש מחדש בסביבה הנוכחית או להשקיע הכל בבניית כל הסביבה, התשתיות והפלטפורמות החדשות. גם בסטטיסטיקה של Dell, האם אתה רואה אנשים שמשתמשים בסביבות הנוכחיות ומפרסים את הפלטפורמה שלך לתשתיות קיימות, או שאתה רואה אותם מפנים את המיקוד שלהם לבניית כל התשתיות החדשות ולהתכונן למבול הזה?
שון רוג'רס: אתה יודע, הייתה לנו הזדמנות לשרת את שני סוגי הלקוחות ולהיות בשוק כל עוד יש לנו, אתה מקבל הזדמנויות כאלה להרחיב. יש לנו לקוחות שיצרו מפעלי fab חדשים לגמרי בשנתיים האחרונות והעניקו להם נתוני חיישנים, IoT, אנליטיקה מהקצה, מקצה לקצה לאורך כל התהליך הזה. אבל הייתי צריך לומר שרוב הלקוחות שלנו הם אנשים שעושים עבודה מסוג זה זמן מה אך נאלצו להתעלם מהנתונים האלה. אתה יודע, רבקה טענה את הנקודה ממש - זה לא נתונים חדשים, מידע מסוג זה היה סוג של זמין בהרבה פורמטים שונים כבר הרבה זמן, אבל היכן שהבעיה הייתה להתחבר אליו, להזיז אותו, להביא אותו למקום שבו אתה יכול לעשות משהו חכם עם זה.
וכך הייתי אומר שרוב הלקוחות שלנו בוחנים את מה שיש להם היום, ודז, אתה הבאת את הנקודה הזו קודם, שזה חלק מאותה מהפכת נתונים גדולים ואני חושב שמה שהוא באמת קשור לזה, זה על הכל מהפכת נתונים, נכון? איננו צריכים להתעלם מנתוני מערכת מסוימים או מנתוני ייצור או לבנות נתוני אוטומציה, כעת יש לנו את הצעצועים והכלים הנכונים ללכת להשיג אותם ואז לעשות איתם דברים חכמים. ואני חושב שיש הרבה נהגים במרחב הזה שגורמים לזה לקרות וחלקם טכנולוגיים. אתה יודע, פתרונות תשתית נתונים גדולים כמו Hadoop ואחרים הפכו את הקצת פחות יקרה וקצת יותר קלה עבור חלק מאיתנו לחשוב על יצירת אגם נתונים מסוג זה של מידע. וכעת אנו מסתכלים סביב הארגון, "היי, יש לנו ניתוחים בתהליך הייצור שלנו, אך האם הם ישופחו אם נוכל להוסיף קצת תובנות מהתהליכים האלה?" וזה, לדעתי, מה רוב הלקוחות שלנו עושים. זה לא כל כך ליצור מהיסוד, אלא להגדיל ולבצע אופטימיזציה של הניתוח שיש להם כבר עם נתונים שהם חדשים להם.
דז בלנשפילד: כן, יש כמה דברים מרגשים שעוברים בכמה מהתעשיות הגדולות ביותר שראינו, והזכרת, את הכוח ואת כלי השירות. התעופה רק עוברת את הבום הזה שבו אחד המכשירים האהובים עלי כל הזמנים שאני מדבר עליהם באופן קבוע, בואינג 787 דרימליינר, ובוודאי המקבילה לאיירבוס, ה- A330 ירד באותו מסלול. היו כמו שש אלפי חיישנים ב- 787 כשהם שוחררו לראשונה, ואני חושב שהם מדברים עכשיו על חמש עשרה אלף חיישנים בגירסה החדשה של זה. והדבר המוזר לדבר עם כמה מהאנשים שנמצאים בעולם ההוא היה שהרעיון להכניס חיישנים בכנפיים וכיוצא בזה, והדבר המדהים שקיים 787 בפלטפורמה עיצובית הוא שידוע לך שהם המציאו מחדש את הכל מחדש המטוס. כמו הכנפיים, למשל, כאשר המטוס ממריא הכנפיים מתפשטות עד שתים עשרה וחצי מטר. אך בקיצוניות הכנפיים יכולות להתכופף בקצהו עד 25 מטר. הדבר הזה נראה כמו ציפור שמתנופפת. אבל מה שלא היה להם זמן לתקן היה הנדסת האנליטיקה של כל הנתונים האלה, כך שיש להם חיישנים שגורמים נוריות לד להבהב ירוק ואדום אם יקרה משהו רע, אבל הם לא מסתיימים עם תובנות עמוקות זמן אמת. והם גם לא פתרו את הבעיה כיצד להעביר את נפח הנתונים מכיוון שבמרחב האווירי המקומי בארה"ב על בסיס יומי יש 87, 400 טיסות. כשכל מטוס מביא לרכישה של 787 דרימליינר, זה 43 פטה ליום של נתונים, מכיוון שמטוסים אלו יוצרים כרגע כחצי טרה-בתים של נתונים. וכשמכפילים את 87, 400 הטיסות ביום בארה"ב בארה"ב בנקודה חמש או חצי טרה-בייט, אתה בסופו של דבר עם 43.5 פטה-נתונים. אנחנו פיזית לא יכולים להזיז את זה. אז על ידי עיצוב אנו צריכים לדחוף את האנליטיקס למכשיר.
אבל אחד הדברים המעניינים כשאני מסתכל על כל הארכיטקטורה הזו - ואני מעוניין לראות מה אתם חושבים על זה - הוא כי התקדמנו לעבר ניהול נתוני אב, מעין, עקרונות ראשונים של ניהול נתונים, משיכת הכל למיקום מרכזי. יש לנו אגמי נתונים ואז אנו יוצרים בריכות נתונים קטנות אם תרצו, תמציות מזה שאנחנו מבצעים אנליטיקס עליהן, אך על ידי חלוקה לקצה, אחד הדברים שממשיכים לעלות, במיוחד מאנשי בסיסי נתונים ומנהלי נתונים. או אנשים שעוסקים בניהול מידע, האם מה קורה כשיש לי הרבה אגמי נתונים זעירים קטנים? אילו דברים יושמו בחשיבה זו בכל הקשור לניתוח קצה בפתרון שלך, בכך שבאופן מסורתי, הכל היה מגיע באופן מרכזי עם אגם הנתונים, עכשיו אנחנו בסופו של דבר שלוליות קטנות של נתונים בכל מקום, ואפילו שאנחנו יכולים בצע ניתוחים באופן מקומי כדי לקבל תובנה מקומית, מהם כמה האתגרים שעומדים בפניך וכיצד פיתרת זאת, לאחר ערכת הנתונים המופצת ובעיקר כשאתה מקבל את המיקרוקוסמוס של אגמי נתונים ואזורים מבוזרים?
שון רוג'רס: אני חושב שזה אחד האתגרים, נכון? כשאנחנו מתרחקים, אתם יודעים, הובלת כל הנתונים חזרה למיקום המרכזי או הדוגמה האנליטית העיקרית שנתתי ואז אנו מבצעים את הגירסה המופצת היא שבסופו של דבר עם כל הסילויים הקטנים האלה, נכון? בדיוק כמו שתיארת, נכון? הם עושים קצת עבודה, יש ניתוחים שפועלים, אבל איך מחברים אותם יחד? ואני חושב שהמפתח עומד להיות תזמור על כל זה ואני חושב שאתה תסכימו איתי, אבל אני שמח אם לא, אני חושב שאנחנו עוקבים אחר ההתפתחות הזו די מתישהו.
חוזר לימיהם של חברינו מר אינמון ומר קימבול שעזרו לכולם בארכיטקטורה של השקעות מחסני הנתונים המוקדמים שלהם, והעניין הוא שאנו נעלמים מהמודל המרכזי הזה במשך זמן רב. אימצנו רעיון חדש זה לאפשר לנתונים להדגים את חומרתם היכן הם צריכים להיות הכי טובים בתוך המערכת האקולוגית שלכם, וליישר את הנתונים לפלטפורמה הטובה ביותר לקבלת התוצאה הטובה ביותר. והתחלנו להוציא סוג של השקעה, לדעתי, גישה מתוזמרת יותר למערכת האקולוגית שלנו כדרך כללית של עשיית דברים, וכך גם אנחנו מנסים ליישר את כל היצירות בבת אחת. איזה סוג אנליטי או עבודה אני הולך לעשות עם הנתונים, איזה סוג נתונים זה יעזור להכתיב היכן הם צריכים לגור. היכן הוא מיוצר ואיזה סוג כוח משיכה יש לנתונים?
אתה יודע, אנו רואים הרבה מהדוגמאות הגדולות של נתונים גדולים שבהם אנשים מדברים על אגמי נתונים של 10- ו -15 פטה. ובכן, אם יש לך אגם נתונים שהוא גדול כל כך, זה מאוד לא מעשי בשבילך להזיז אותו ולכן אתה צריך להיות מסוגל להביא אליו ניתוחים. אבל כשאתה עושה את זה, לליבת שאלתך, אני חושב שזה מעלה המון אתגרים חדשים לכולם לתזמור את הסביבה וליישם ממשל וביטחון ולהבין מה צריך לעשות עם הנתונים האלה כדי לאצור אותה להפיק מזה את הערך הגבוה ביותר. ולמען האמת איתך - אשמח לשמוע את דעתך כאן - אני חושב שאנחנו ימינו הראשונים ואני חושב שיש עוד הרבה עבודה טובה. אני חושב שתוכניות כמו סטטיסטיקה מתמקדות במתן לאנשים רבים יותר גישה לנתונים. אנו בהחלט ממוקדים בפרסומות החדשות הללו כמו מדען נתונים אזרחיים שרוצים להעביר ניתוחים חזויים למקומות בארגון שאולי לא היה זה קודם. ואני חושב שאלו הם חלק מהימים הראשונים סביב זה, אבל אני חושב שקשת הבשלות תצטרך להפגין רמה גבוהה או תזמור והתאמה בין הפלטפורמות הללו, והבנה של מה ולמה. וזו בעיה של פעם בעיני כולנו.
דז בלנשפילד: אכן כך ואני מסכים איתך לגמרי על זה, ואני חושב שהדבר הנהדר שאנחנו שומעים כאן היום הוא לפחות הקצה הקדמי של הבעיה של ממש ללכוד את הנתונים ברמת השער בקצה. של הרשת והיכולת לבצע ניתוחים באותה נקודה נפתרת למעשה כעת. וזה משחרר אותנו להתחיל לחשוב בפועל על האתגר הבא, שמופץ אגמי נתונים. תודה רבה לך על כך, זו הייתה מצגת פנטסטית. אני מאוד מעריך את ההזדמנות לשוחח איתך בקשר לזה.
אני אעבור לרובין עכשיו כי אני יודע שיש לו, ואז גם לרבקה יש רשימה ארוכה של שאלות נהדרות מהקהל אחרי רובין. רובין?
ד"ר רובין בלור: אוקיי. שון, הייתי רוצה שתגיד קצת יותר ואני לא מנסה לתת לך את ההזדמנות לפרסם את זה, אבל זה בעצם מאוד חשוב. אני מעוניין לדעת באיזו נקודת זמן סטטיסטיקה באמת יצרה את יכולת הייצוא של הדגם. אבל גם אני, הייתי רוצה שתגיד משהו על בומי מכיוון שכל מה שאמרת עד כה על בומי הוא שזה ETL, וזה אכן ETL. אבל זה למעשה ETL מסוגל למדי ולגבי התזמונים שאנחנו מדברים עליהם, וחלק מהמצבים עליהם אנו דנים כאן, זה דבר חשוב מאוד. האם אתה יכול לדבר עם שני הדברים האלה בשבילי?
שון רוג'רס: בטח, כן, אני בהחלט יכול. אתה יודע, התנועה שלנו לכיוון זה בהחלט הייתה איטרטיבית וזה היה מעין תהליך שלב אחר שלב. אנו רק מתכוננים בשבוע הקרוב להשקת גרסה 13.2 לסטטיסטיקה. ויש לו את העדכונים החדשים ביותר של כל היכולות עליהם אנו מדברים היום. אבל כשחזרנו לגרסה 13, לפני שנה באוקטובר, הכרזנו על היכולת שלנו לייצא דגמים מהפלטפורמה שלנו, וקראנו לזה אז NDAA. ראשי התיבות עמדו על ארכיטקטורה של Native Distribised Analytics. מה שעשינו זה שאנחנו שמים הרבה זמן, אנרגיה והתמקדות בפתיחת הפלטפורמה שלנו עם ההזדמנות להשתמש בה כמרכז פיקוד מרכזי לניתוח המתקדם שלכם, אך גם לפרוס משם. והמקומות הראשונים, רובין, שפרסנו עשינו תוספת ממש ממש נהדרת לפלטפורמה סביב למידת מכונה. וכך הייתה לנו היכולת לפרוס מסטטיסטיקה ל Azure Cloud של מיקרוסופט כדי להשתמש בכוח של Azure להעצמת למידת מכונות, כידוע, היא אינטנסיבית מאוד וזו דרך נהדרת להשתמש בטכנולוגיות ענן. וכך זה היה הקטע הראשון.
הנה, היינו מייצאים את הדגמים שלנו ל- Azure והשתמשנו ב- Azure כדי להריץ אותם ואז שלחנו את הנתונים, או את התוצאות, חזרה לפלטפורמת Statistica. ואז עברנו לשפות אחרות שרצינו להיות מסוגלים לייצא מהן, וכמובן שאחת מהן היא ג'אווה פותחת בפנינו את הדלת, וכעת נתחיל לייצא את הדגמים שלנו החוצה למקומות אחרים כמו Hadoop, אז זה נתן גם לנו שם מחזה.
ולבסוף התמקדנו ביכולת להפיק את המודלים שלנו עם ההפצה הזו למאגרי מידע. וכך זה היה האיטרציה הראשונה ולמען האמת איתך, משחק הסיום היה IoT אבל עדיין לא היינו עדיין שם עם גרסה 13 באוקטובר האחרון. מאז הגענו לשם וזה קשור ליכולת לעשות את כל הדברים שרק הזכרתי, אבל אז שיהיה לנו מכשיר תחבורה כלשהו. ולחזור לשאלת דז ', אתה יודע, מה האתגר וכיצד אנו עושים זאת כשיש לנו את כל הניתוחים האלה? ובכן, אנו משתמשים בבומי כמעין רכזת הפצה ולכן הוא בענן ומכיוון שהוא כל כך חזק, כמו שציינתי קודם, זו פלטפורמת שילוב נתונים, אך היא גם פלטפורמת שילוב יישומים והיא משתמשת ב- JVMs כדי לאפשר לנו לחנות ולעשות עבודה בכל מקום שתוכלו להנחית מכונה וירטואלית של Java. זה מה שבאמת פתח את הדלת עבור כל השערים האלה ופלטפורמות מחשוב הקצה ושרתי הקצה, מכיוון שלכולם יש את המחשוב והפלטפורמה הזמינה להפעלת JVM. מכיוון שאנחנו יכולים להריץ את JVM בכל מקום, בומי הפכה זו הפצה נפלאה, ובעזרת המילה שלי מקודם, מכשיר תזמורתי.
וזה נהיה ממש חשוב כי כולנו, אתה יודע, אני חושב שתסריט המטוס לפני דקה היה נהדר, וציינתי, אתה יודע, יצרנים כמו שייר שיש להם עשרת אלפים חיישנים באחד המפעלים שלהם, אתה צריך להתחיל להתייחס לסוג הגישה המרכזית לניתוח מתקדם בשלב מסוים. להיות אד הוק לגבי זה כבר לא עובד. זה היה פעם כאשר נפח הדגמים והאלגוריתמים שהפעלנו היה מינימלי, אבל עכשיו זה מקסימום. יש אלפים מהם בארגון. אז יש לנו, חלק מהפלטפורמה שלנו מבוססת שרתים וכשיש לך תוכנה ארגונית שלנו, יש לך גם את היכולת לצבוט ולהבקיע ולנהל את המודלים שלך בסביבה. וזה גם חלק מאותו דבר תזמורתי. היינו צריכים שיהיה לנו רובד, רובין, במקום שלא רק אפשר לך להשיג שם דוגמנית מלכתחילה, אלא גם נתן לך צינור לצבוט את הדגמים ולהחליף אותם באופן שוטף בתדירות הנחוצה, כי זה לא משהו שאתה יכול לעשות ידנית. אתה לא יכול להסתובב בבית זיקוק עם כונן אגודל ומנסה להעלות דגמים לשערים. צריך להיות ביניהן מערכת הובלה וניהול וכך השילוב של סטטיסטיקה ובומי נותן את זה ללקוחות שלנו.
ד"ר רובין בלור: כן. ובכן אני אהיה קצרה מאוד, אבל אתה יודע, ההצהרה הזו שנאמרה לפני כן על אגם הנתונים והרעיון לצבור פטיטים בכל מקום נתון, והעובדה שיש לו כוח משיכה. אתה יודע, כשהתחלת לדבר על תזמור זה פשוט התחיל לגרום לי לחשוב על העובדה הפשוטה ביותר שאתה יודע, לשים אגם נתונים שהוא גדול מאוד במקום אחד כנראה אומר שאתה צריך לגבות אותו וזה כנראה אומר ש בכל מקרה צריך להעביר הרבה נתונים. אתה יודע, ארכיטקטורת הנתונים האמיתית היא הרבה יותר, לדעתי בכל מקרה, הרבה יותר בכיוון שאתה מדבר עליו. שזה להפיץ אותו למקומות הגיוניים, זה כנראה הדבר שהייתי אומר. ונראה שיש לך יכולת טובה מאוד לעשות זאת. כלומר, אני מעודכן היטב את בומי אז זה בצורה, כזו או אחרת, כמעט לא הוגנת שאני יכול לראות את זה ואולי הקהל לא יכול. אבל בומי היא כה חיונית, בעיניי, מבחינת מה שאתה עושה מכיוון שיש לו יכולות יישומים. וגם מכיוון שאמת העניין היא שאתה לא עושה את החישובים האנליטיים האלה מבלי לרצות לפעול במקום כלשהו מסיבה זו או אחרת. ובומי משחק בזה חלק, נכון?
שון רוג'רס: כן, בהחלט. וכך, כפי שידוע משיחות קודמות, לסטטיסטיקה יש מנוע כללי עסק מלא. ואני חושב שזה ממש חשוב כשאנחנו מסתדרים מדוע אנחנו עושים את זה. אתה יודע, התבדחתי מלפנים שבאמת אין שום סיבה לעשות IoT אלא אם כן אתה הולך לנתח, להשתמש בנתונים כדי לקבל החלטות טובות יותר או לנקוט בפעולות. ולכן מה שהתמקדנו בו לא היה רק היכולת להציב את הדגם שם בחוץ, אלא להיות מסוגל לתייג איתו, סט כללי. ומכיוון שבומי הוא כה חזק ביכולותיו להעביר דברים ממקום למקום, בתוך אטום של בומי אנו יכולים גם לשבץ את היכולת להפעיל, להתריע ולנקוט בפעולה.
וכך אנו מתחילים לקבל השקפה מתוחכמת מסוג זה של נתוני IoT, שם אנו אומרים, "אוקיי, נתונים אלה שווה להקשיב להם." אבל באמת, אתה יודע, בידיעה ש"האור דולק, האור דולק, האור דולק, האור דולק "לא כל כך מעניין מתי האור כבה או כשגלאי העשן כבה או כשכל מה שקורה לתהליך הייצור שלנו יוצא מכל המפרט. כאשר זה קורה אנו רוצים להיות מסוגלים לנקוט בפעולה מיידית. והנתונים הופכים כמעט משניים כאן בנקודה זו. מכיוון שזה לא כל כך חשוב ששמרנו את כל אלה, "זה בסדר, זה בסדר, זה בסדר" איתותים, מה שחשוב זה שנשים לב ל"הי, זה רע "ונקטנו בפעולה מיידית. בין אם זה שולח דוא"ל למישהו או שאנחנו יכולים להיות מעורבים במומחיות בתחום, ובין אם נפתח סדרה של תהליכים אחרים לנקוט בפעולה מיידית, בין אם זה מתקין או בתגובה למידע. ואני חושב שזו הסיבה שאתה צריך לראות את התצוגה המתוזמרת הזו. אתה לא יכול פשוט להתמקד בהתמודדות עם האלגוריתמים שלך בכל מקום. אתה צריך להיות מסוגל לתאם ולתכנן אותם. אתה צריך להיות מסוגל לראות את הביצועים שלהם. ובאמת, והכי חשוב, אני מתכוון, מדוע לעזאזל הייתם עושים זאת אם לא תוכלו להוסיף את ההזדמנות לנקוט בפעולה מיידית כנגד הנתונים?
ד"ר רובין בלור: אוקיי, רבקה, אני מאמין שיש לך שאלות מהקהל?
רבקה יוז'ויאק: כן. יש לי המון שאלות קהל. שון, אני יודע שלא רצית להסתובב יותר מדי עם חלוף השעה. מה אתה חושב?
שון רוג'רס: אני שמח. לך על זה. אני יכול לענות על כמה.
רבקה יוז'ויאק: בוא נראה. אני יודע שאחד הדברים שציינת היה שה- IoT נמצא בימים הראשונים ויש לו מידה של בגרות שתצטרך להתרחש וזה דיבר בשאלה זו, שאל אחד המשתתפים. אם מסגרת ה- IPv6 תהיה חזקה מספיק בכדי להתאים את הצמיחה של IoT בחמש או עשר השנים הבאות?
שון רוג'רס: אה, אני אתן לדז להדהד מהתשובה שלי כי אני חושב שהוא קרוב יותר לסוג המידע הזה שאני. אבל תמיד חשבתי שאנחנו בדרך מהירה מאוד להתכופף ולשבור את רוב המסגרות שיש לנו במקום. ובעוד אני חושב שתוספת של מפרט חדש מסוג זה או הכיוון שאליו אנו הולכים עם מסגרות IPv6 חשובה, והיא פותחת בפנינו את הדלת כדי שיהיו לנו הרבה יותר מכשירים, וכדי שנוכל לתת את כל מה שאנחנו רוצה למסור כתובת. אני חושב שכל מה שאני קורא ורואה עם הלקוחות שלי, ומספר הכתובות הנדרשות, אני חושב שבשלב מסוים הולך לגרום לשינוי נוסף בנוף ההוא. אבל אני לא ממש מומחה ברשת ולכן אני לא יכול לומר מאה אחוז שאנחנו הולכים לשבור את זה בשלב מסוים. אבל הניסיון שלי אומר לי שאנחנו מתכוונים לשבש את המודל הזה בשלב מסוים.
רבקה יוז'ויאק: לא אתפלא. אני חושב שמסגרות הן סוג של שבירה תחת המשקל של כל מיני דברים. וזה פשוט הגיוני, נכון? כלומר, אינך יכול לשלוח דוא"ל עם מכונת כתיבה. משתתף אחר שואל, "האם אתה יכול להשתמש במסגרת Hadoop?", אבל אני מניח שאוכל לשנות זאת כדי לומר, איך היית משתמש במסגרת Hadoop לניתוח מבוזר?
שון רוג'רס: ובכן, רובין עשה לי את החיבה לשאול אותי שאלה היסטורית ולכן מאז גרסה 13 לפני כשנה לסטטיסטיקה, הייתה לנו היכולת להוציא דוגמניות מהמערכת שלנו ולחדרת Hadoop. ואנחנו עובדים מקרוב עם כל הטעמים הגדולים של Hadoop. יש לנו סיפורי הצלחה ממש גדולים סביב היכולת לעבוד עם קלודרה כאחת ההפצות העיקריות של Hadoop שאנו עובדים איתן. אך מכיוון שאנו יכולים להפיק ב- Java, זה נותן לנו את היכולת הזו להיות פתוחים ולמקם את האנליטיקס שלנו בכל מקום. הצבתם באשכול Hadoop היא דבר שאנחנו עושים על בסיס רגיל וסדיר ויומיומי עבור רבים מלקוחותינו. התשובה הקצרה היא כן, בהחלט.
רבקה יוז'ויאק: מעולה. ואני רק אזרוק לעברך עוד אחד ויאפשר לך להמשיך עם החופשה שלך. משתתף אחר שואל, בעזרת ניתוח IoT פלוס למידת מכונה, אתה חושב שצריך לשמור את כל הנתונים למטרות היסטוריות וכיצד זה ישפיע על ארכיטקטורת הפתרונות?
שון רוג'רס: ובכן, אני לא חושב שצריך לאחסן את כל הנתונים. אבל אני כן חושב שמעניין מאוד לקבל את היכולת לבדר, להקשיב לכל מקור נתונים שאנחנו רוצים בתוך הארגון שלנו, מכל מקום שהוא בא. ואני חושב שהשינויים שראינו בשוק במהלך השנים האחרונות אפשרו לנו לנקוט בגישה זו של כל הנתונים לדברים ונראה שזה ממש משתלם. אבל זה הולך להיות שונה לכל חברה ולכל מקרה לשימוש. אתה יודע, כשאנחנו בוחנים את נתוני הבריאות, עכשיו יש המון סוגיות רגולטוריות, המון בעיות ציות שיש לדאוג להן וזה גורם לנו לשמור נתונים שחברות אחרות אולי לא מבינות למה צריך לשמור אותה, נכון ? בתהליכי הייצור, עבור רבים מלקוחות הייצור שלנו, ישנו חזית אמיתית להיות מסוגלים לבחון באופן היסטורי את התהליכים שלך ולהיות מסוגלים להביט לאחור על כמויות גדולות של נתונים אלה כדי ללמוד מהם ולבנות מהם מודלים טובים יותר.
אני כן חושב שצריך לשמור הרבה מהנתונים ואני חושב שיש לנו פתרונות שהופכים את זה לחסכוני יותר וניתן להרחבה היום. אך יחד עם זאת אני חושב שכל חברה תמצא ערך בנתונים שהם לא צריכים לשמור ברמה האטומית, אבל הם ירצו לנתח בצורה בזמן אמת ולקבל החלטות בנושא כדי להניע חדשנות בתוך החברה שלהם.
רבקה יוז'ויאק: טוב טוב. לא, קהל, לא הגעתי לשאלות של כולם היום, אבל אעביר אותם לשון כדי שיוכל להגיע אליך ישירות ולענות על השאלות האלה. אבל תודה לכולם שהשתתפו. תודה רבה לשון רוג'רס מדל סטטיסטיקה ומכל האנליסטים שלנו, דז בלנשפילד וד"ר רובין בלור. אתה יכול למצוא את הארכיון כאן ב insideanalysis.com, SlideShare, התחלנו להחזיר את הדברים אלינו שוב, ואנחנו מחדשים את YouTube שלנו אז חפש גם את זה שם. תודה רבה אנשים. ועם זה אני הולך להיפרד ממך ונראה אותך בפעם הבאה.