ש:
האם נתונים גדולים הם פיתרון מתאים לכל גודל?
ת:במסגרת הרעיון של מערכת אקולוגית או ענף גדול של נתונים גדולים, יישומים של אסטרטגיות נתונים גדולים הם ספציפיים לצרכים של עסק או ארגון מסוים. אחת הטעויות הגדולות ביותר שמנהלים ואנשי מקצוע אחרים מבצעים היא לנקוט בגישה כללית לנתונים גדולים ולנסות להתאים מערכות לתבנית ששימשה אותה בעבר.
הפילוסופיה של נתונים גדולים קשורה לשימוש מאוד ממוקד וממומני בבריכות מידע גדולות. לדוגמה, חברה שיש לה אלפי ואלפי לקוחות תעבור פרויקט נתונים גדול כדי לרתום את כל המידע שיש לה על אותם לקוחות - שמם, איפה הם גרים, מה שהם קנו בעבר וכו '. עם זאת, התוצאות הן יותר לעשות עם הקמת מבנים ספציפיים למניפולציה ודיווח של נתונים מאשר לעשות רק עם איסוף ו"הפעלה "של מערכי נתונים מסיביים אלה.
חלק מהאתגר של נתונים גדולים הוא שהוא דורש תהליכי חומרה מתמחים יותר. חברות משתמשות לעתים קרובות במערכות קוד פתוח כמו אפאצ'י חאדו, וכלים קשורים ספציפיים כמו MapReduce כדי להשיג פתרונות נתונים גדולים. זה דורש ידע טכני נוסף מעבר להגדרת טבלת גישה של Microsoft או רדיפה אחר טכנולוגיות מסד נתונים פשוטות אחרות.
כדי להפוך את הנתונים הגדולים ליעילים, חברות צריכות לבדוק את היישום וכיצד להימנע משיבוש הפעילות העסקית הרגילה שלהן. כדי להפוך את היעיל ביותר לביצוע, הם צריכים לבדוק בדיוק אילו מערכות נתונים יהיו מועילים להם ביותר. לדוגמה, אם אנשי מכירות או אחרים יכולים לעשות את מה שהם צריכים לעשות עם דוח פשוט של שמות משפחה, מדינות ומספרי טלפון בלבד, אין זה הגיוני לנסות להעביר נתונים נרחבים יותר דרך המערכת ולנסות לאסוף ולהציג מזהים אחרים או פיסות מידע מרכזיות.
אפקטיביות, יישום קל ועלות גורמים להופעה של פתרונות נתונים גדולים ספציפיים לחברה. חידושים אלה בהחלט תלויים במודל עסקי מסוים, ובבעיות שיש לפתור.