ש:
יותר לא תמיד טוב יותר. כיצד ארגונים יכולים להפחית את הרעש בנתונים שלהם בכדי להשיג ניתוחים ממוקדים ומדויקים?
ת:עם מערכות הנתונים הגדולים, אחת השאלות הגדולות עבור חברות היא כיצד לשמור על פרויקטים אלה ממוקדים ויעילים היטב. רבים מהכלים והמשאבים שנבנו עבור נתונים גדולים בנויים לכדי שאיבת כמויות אדירות של מידע ברשת רחבה. הם לא תמיד קשובים לעדן הזנת נתונים ולהקפיד עליהם. עם זאת, יש כמה שיטות מומלצות המתעוררות בענף על מנת ליצור פרויקטים גדולים יותר של נתונים גדולים ויעילים.
עמוד תווך בגישת נתונים גדולים ממוקדת הוא להשתמש בכלי ומשאבי התוכנה הנכונים. לא כל מערכות הניתוח ומערכות הנתונים הגדולות זהות. חלקם יכולים לסנן נתונים יעילים יותר או לא רלוונטיים, ולאפשר לעסקים להתמקד רק בעובדות החיוניות שיקבעו את תהליכי הליבה ואת פעולתם.
חלק מרכזי נוסף בזה מעורב אנשים. לפני שהשתתף בפרויקט Big Data, ובמקביל למימון תוכנת ספקים, רדיפה אחר יישום והדרכה של אחרים, קבוצה מרכזית של אנשים צריכה להיות אחראית על התהליך, ולהאציל גם משימות מחקר וסיעור מוחות. זה יכול להפוך גישה לגישה גדולה של נתונים לשיטה כירורגית מדויקת שתעצים את העסק מבלי להפוך לכבד מדי מדי ולהפריע לפעולות היום-יומיות.
לדוגמא, כוחות משימה או קבוצות ליבה אחרות יכולים לשבת ולהסתכל בפירוט על הדרכים בהן ייעשה היישום, כיצד העסק יתחיל להעריך את מערכי הנתונים, כיצד יחצו בין חשבונות, איזה סוג נייר או מצגות דיגיטליות בהן ישמשו להפצת מידע זה, כיצד יבנו דוחות שימושיים וכו '. הפרטים האלה יגנו על העסק מפני התפשטות נתונים גדולים.
כמו כן, ככל שחברות מתחילות לרכוש שירותי ספקים רבים יותר, לבצע יותר פריצות נתונים גדולים ולהפוך את ארכיטקטורות ה- IT למורכבות יותר, הם למדו להפריד את הנתונים הרגישים ביותר מכל השאר.
אחת הדרכים לעשות זאת היא ליצור מערכת שכבתית. לדוגמה, מערך נתוני ליבה של מזהי לקוחות והיסטוריות ניתן לשמור במאגר נתונים שמתוחזק במיוחד תחת חוזה אבטחה ענן מסוים, או באתר. קבוצות נתונים אחרות יכולות להתגורר בסביבות נתונים פחות מתמחות, בין אם בגלל שהן פחות רגישות מבחינת הפרות נתונים, או מכיוון שהן פחות רלוונטיות ישירות לניתוח שהעסק עושה. מערכות שכבות או מרובות רמות מאפשרות יישום של נתונים גדולים וחסכוניים.
אלה כמה מהדרכים בהן עסקים מתחכמים לקבל נתונים גדולים בדרך הנכונה. במקום להסתפק בשאיבת אבק של נתונים שהם יכולים לתפוס, הם מתייחסים לקבוצת נתונים מסוימת כחיונית ביותר כדי להשיג את המודיעין העסקי ביותר במעט מאמץ.