ש:
מה המשמעות של נתונים גדולים עבור נתונים סטטיסטיים רשמיים?
ת:השאלה עד כמה נתונים גדולים עשויים לשנות נתונים סטטיסטיים רשמיים, ומחקר של סוכנויות פדרליות או ממשלתיות, היא שאלה מרתקת, בין היתר בגלל האופי של מערכות כריית ואיסוף נתונים מודרניות.
במובנים מסוימים, נתונים גדולים מתחרים בשיטות מסורתיות אחרות לאיסוף מידע. לדוגמה, נתונים מצטברים רחבים מהאינטרנט יכולים להיות חיזוי מדויק יותר ממה שמופק על ידי "קהילת מומחים" בענף נתון. פירוש הדבר שמידע גדול עשוי לדחוף סוגים שונים של נתונים סטטיסטיים רשמיים לעבר תחזיות מדויקות יותר או מתודולוגיה יעילה יותר.
דרך נוספת בה עשוי הנתונים לשנות נתונים סטטיסטיים רשמיים היא ששיטות מחקר עתידיות עשויות לשלב פתרונות נתונים גדולים כדי ליהנות ממרכיב זה במאמץ מחקרי. לדוגמה, משרד המפקדים האמריקני מבצע ביקורות פיזיות רבות של אנשים, בניינים ותשתיות בתוך ארה"ב, ומבסס את הנתונים הסטטיסטיים על תצפיות ותגובות בזמן אמת. בניית נתונים גדולים למאמצים של לשכת מפקד האוכלוסין האמריקאית עשויה להיות פירושם צבירת נתוני אינטרנט על אותן מערכות והשוואה בין הדברים למה העובדים מגלים בתחום. ישנן מספר דרכים לשילוב נתונים גדולים ומחקרי שדה, שיקבעו את התוצאות הספציפיות לכל סוג של פרויקט מחקר כלכלי, חברתי או ספציפי לתעשייה.
בקיצור, נתונים גדולים ישנו את הסטטיסטיקה הרשמית לצורת דיווח מודרנית ומתוחכמת יותר, כזו שבה טבליות פיזיות זהירות משופרות על ידי מודלים ואלגוריתמים טכניים העובדים על בסיס ממוצע או השלכה מכמויות אדירות של נתונים מכורים או שנאספו. זו רק אחת הסיבות לכך שההמון העצום של נתונים גדולים שנאספו על ידי ממשלות ועסקים כל כך חשוב ונשמר בקפידה.