תוכן עניינים:
האתגר בניהול ומינוף של נתונים גדולים מגיע משלושה גורמים, לפי דאג לייני, סגן נשיא המחקר בגרטנר. לייני ציין לראשונה לפני למעלה מעשור כי נתונים גדולים מהווים בעיה כזו עבור הארגון מכיוון שהם מציגים נפח, מהירות ומגוון קשה לניהול. הבעיה היא שרוב מחלקות ה- IT יותר מדי זורקות את כל מה שיש להם לנושאים של נפח נתונים ומהירותם, ושוכחים לטפל בסוגיה הבסיסית של מגוון הנתונים.
עוד בשנת 2001 כתב לייני כי "ארגונים מובילים ישתמשו יותר ויותר במחסן נתונים מרכזי כדי להגדיר אוצר מילים משותף המשפר את שיתוף הפעולה הפנימי והחיצוני." נושא אוצר המילים ההוא - והשונות שמונעת מחברות ליצור אותו - נותר היבט הכי פחות ממוכן של מצוקת המידע הגדול כיום. (בדוק מה יש למומחים אחרים לומר. עיין במומחי ביג דאטה שעוקבים אחריהם בטוויטר.)
שלושה Vs של נתונים גדולים
עסקים רבים מצאו שיטות לרתום את נפח הנתונים ואת מהירותם מוגברת. פייסבוק, למשל, יכולה לנתח כמויות עצומות של נתונים. כמובן, נתונים אלה מוצגים לעתים קרובות שוב ושוב באותו פרמטרים. זה הניע חידושים טכנולוגיים כמו מסדי נתונים של עמודות, שמשמשים כיום נרחב על ידי חברות אחרות העומדות בפני חנויות לא פחות גדולות של פריטי נתונים דומים.