בית מגמות 6 מיתוסים גדולים בנושא ניהול נתונים גדולים

6 מיתוסים גדולים בנושא ניהול נתונים גדולים

תוכן עניינים:

Anonim

בחודש מאי 2014 פרסמה מחקר פורסטר שני דו"חות שהסקו מסקנות מסוימות לגבי ההייפ סביב נתונים גדולים. חברת המחקר סקרה למעלה מ- 250 מנהלי שיווק ופיתוח עסקי. לטענת עורכי הדו"ח, הרטוריקה של הנתונים הגדולים נמצאת בשיא כל הזמנים, וספקי הטכנולוגיה מציגים מוצרים עם מה שנראה כתביעות מדהימות.


גרטנר מסכים עם פורסטר מחקר; הייפ משמעותי מקיף נתונים גדולים. בדוח של ספטמבר 2014 גרטנר מתמכר בחמישה ממיתוסי הנתונים הגדולים ביותר, ואנליסטים של גרטנר מציעים את דעתם לגבי מה שלא הובן ביחס לנתונים הגדולים ולמניפולציה שלהם. אז מהם המיתוסים הגדולים של נתונים גדולים? בוא נראה.

מיתוס: כולם לפנינו באימוץ נתונים גדולים.

גרטנר אומר שההתעניינות בנתונים גדולים עולה בשיא כל הזמנים. למרות זאת, ל -13 אחוזים מהסקרנים יש מערכות עבודה. הסיבה: מרבית החברות טרם הבינו כיצד ניתן לכרות ערך כלשהו ממאגרי נתונים גדולים. כאן, הסקר של גרטנר אופטימי יותר מדו"ח פורסטר ", שמצא שרק 9 אחוז ממשתתפי הסקר אמרו כי הם מתכננים ליישם את הטכנולוגיות הגדולות של נתונים גדולים בשנה הבאה. (לנתונים גדולים יש הרבה מה להציע. למידע נוסף על 5 בעיות בעולם האמיתי שביג דאטה יכול להיפתר.)

מיתוס: יש לנו כל כך הרבה נתונים; איננו צריכים לדאוג לכל פגם קטן בנתונים.

גרטנר מודאג מכדאיות שיש לנו בבני אדם: "יש לנו כל כך הרבה, הקטן שזה רע לא משנה." טד פרידמן, סגן נשיא ואנליטיקאי מכובד בגרטנר סבור שזו הדרך הלא נכונה להסתכל על המצב.


פרידמן אמר כי "במציאות, למרות שלכל פגם אינדיבידואלי יש השפעה קטנה בהרבה על כל מערך הנתונים, מאשר בה היו פחות נתונים, ישנם יותר פגמים מאשר בעבר מכיוון שיש יותר נתונים". "לכן, ההשפעה הכוללת של נתונים באיכות ירודה על מערך הנתונים כולו נותרה זהה."


פרידמן מוסיף סיבה נוספת לדאגה. לכידת נתונים גדולים כוללת לעתים קרובות נתונים מחוץ לעסק, אשר אם כן הם בעלי מבנה ומוצא לא ידוע. זה מגדיל את פוטנציאל השגיאות.

מיתוס: טכנולוגיית נתונים גדולה תבטל את הצורך בשילוב נתונים.

ישנן שתי אסטרטגיות מפתח לניתוח נתונים העשויות להחיל על נתונים גדולים: "סכמה על כתיבה" או "סכמה בקריאה". עד לאחרונה, סכימות בכתיבה היו השיטה היחידה בה נעשה שימוש. סכמה לקריאה היא השיגעון הנוכחי בניהול מסדי נתונים. בשונה מסכימות על הכתיבה, הדורשת תבנית מובנית, נתונים נטענים למסדי נתונים שקוראים קריאה בפורמט הגולמי. ואז מפתחים - המשתמשים בפלטפורמות מסד נתונים לא מובנות כמו Hadoop - מכופפים את הנתונים השונים לפורמט שמיש. לסכמה שקראה יש יתרונות ברורים, אך כפי שציין גרטנר, שילוב נתונים צריך להתרחש בשלב מסוים.

מיתוס: השימוש במחסן נתונים לניתוח מתקדם הוא חסר טעם.

לבזבז את הזמן ליצירת מחסן נתונים נראה חסר טעם עבור מנהלי מידע רבים, במיוחד כאשר נתונים שנלכדו לאחרונה שונים מאלה שבמחסן הנתונים. עם זאת, גרטנר שוב מזהיר כי אפילו ניתוחים מתקדמים של נתונים ישתמשו במחסני נתונים ובנתונים חדשים, מה שאומר שמשלבי נתונים חייבים:

  • צמצם את סוגי הנתונים החדשים כדי להתאים אותם לניתוח
  • החלט אילו נתונים הם רלוונטיים, ואת רמת איכות הנתונים הדרושה
  • קבע כיצד לצבור את הנתונים
  • הבינו ששכלול נתונים יכול לקרות במקומות שאינם מחסן הנתונים

מיתוס: אגמי נתונים יחליפו את מחסן הנתונים.

אגמי נתונים הם מאגרים של נתונים שונים, לעומת מחסני נתונים שבהם הנתונים בפורמט מובנה. יצירת אגם נתונים דורשת מאמץ מעט מראש (אין צורך לפרמט את הנתונים) לעומת מחסני נתונים, וזו הסיבה שאגמי נתונים מעניינים אותם.


גרטנר מדגיש כי אין בכך את העניין - היכולת לתמרן את הנתונים שנלכדו לקבלת החלטות מושכלות היא הנקודה. יתר על כן, השימוש באגמי נתונים (לא מוכחים) כדי להקל על קבלת ההחלטות הוא בעייתי.


ניק מחודר, מנהל המחקר בגרטנר, אמר כי "למחסני נתונים כבר יש את היכולות לתמוך במגוון רחב של משתמשים ברחבי ארגון." "מנהיגי ניהול מידע לא צריכים לחכות לאגמי נתונים כדי להתעדכן." (למידע נוסף על אימוץ נתונים גדולים ב- 7 דברים שעליכם לדעת על נתונים גדולים לפני אימוץ.)

Big Data Works - שיטות מניפולציה חדשות עשויות שלא

הסיבה לכך שגרטנר אמר כי "מיתוסי הנתונים הגדולים ביותר" במקום "מיתוסים גדולים-נתונים" מתבררת לאחר שקרא את הדו"ח. גרטנר אינו מבולבל של נתונים גדולים. גרטנר מעורר זלזול במי שמרגיש שהשיטות החדשות יותר לתמרון נתונים גדולים מוכנים ל"פריים טיים ".

6 מיתוסים גדולים בנושא ניהול נתונים גדולים