דרו יציג בוועידת החדשנות של ביג דאטה, 30 ו- 31 בינואר בלאס וגאס: http://analytics.theiegroup.com/bigdata-lasvegas, לצד דוברי אובמה לאמריקה, בסט ביי, לינקדאין, הניו יורק טיימס, נוקיה, ביטלי, בארנס ונובלס, מעבדות וולמארט ורבים אחרים.
קישור הרשמה: http://bit.ly/Zs3wms
ראיון זה נערך על ידי ג'ורג 'היל ופורסם במגזין Big Data Innovation.
איזו תגובה הייתה לחיזוי שלך?
מרבית התגובה התמקדה בהבדל ברמת הדיוק בין אלו מאיתנו שחקרו את סקרי דעת הקהל, לבין תחזיות הבטן "תחושת הבטן" של פרשנים ופרשנים פופולריים. ביום הבחירות, אנליסטים כמוני, נאט סילבר (הבלוג של ניו יורק טיימס FiveThirtyEight), סיימון ג'קמן (אוניברסיטת סטנפורד והפינגטון פוסט) וסאם וואנג (קונסורציום הבחירות בפרינסטון), כולם הציבו את סיכויי הבחירה החוזרת של אובמה על מעל 90%, וראו נכון נכון 332 קולות בחירות לאובמה כתוצאה ככל הנראה. בינתיים, עלונים כמו קארל רוב, ג'ורג 'וויל וסטיב פורבס אמרו שרומני עומד לנצח - ובמקרים מסוימים, בקלות. זה הוביל לדיבורים על "ניצחון לקוונטים" שאני מקווה שתעביר לבחירות עתידיות.
כיצד אתה מעריך את האלגוריתם המשמש בתחזיות שלך?
מודל החיזוי שלי העריך את תוצאות ההצבעה במדינה ואת ההצבעה הסופית לבחירות, בכל יום של הקמפיין, החל ביוני. רציתי שההערכה של תחזיות אלה תהיה הוגנת ואובייקטיבית ככל האפשר - ולא תשאיר לי שום מקום להתנודד אם הן טועות. אז כחודש לפני הבחירות פרסמתי באתר שלי קבוצה של שמונה קריטריונים להערכה שאשתמש בהם ברגע שהתוצאות היו ידועות. כפי שהתברר, הדגם עבד בצורה מושלמת. זה ניבא במהלך הקיץ שאובמה ינצח בכל מדינות 2008 מינוס אינדיאנה וצפון קרוליינה, ובקושי זז מהתחזית הזו גם לאחר שהתמיכה באובמה זינקה כלפי מעלה בספטמבר, ואז טבלה לאחר הוויכוח הראשון לנשיאות.
כמות הנתונים בהם נעשה שימוש במהלך קמפיין זה הן על ידי אנליסטים עצמאיים והן על ידי צוותי קמפיין הייתה עצומה, אילו סוגים של השלכות זה על השימוש בנתונים בשנת 2016?
קמפיין 2012 הוכיח כי ניתן לנהל, לסמוך ולהחיל בהצלחה מקורות רבים ומגוונים של מידע כמותי למטרות שונות ומגוונות. אנחנו מבחוץ הצלחנו לחזות את תוצאת הבחירות בהרבה מראש. בתוך הקמפיינים חלו צעדים עצומים במיקוד הבוחרים, מעקב אחר דעות, גיוס כספים והצבעה. עכשיו כשאנחנו יודעים שהשיטות הללו יכולות לעבוד, אני חושב שאין דרך חזרה. אני מצפה מכתבים ופרשני קמפיין שיתייחסו לצבירת הסקר הרבה יותר ברצינות בשנת 2016. ולמרות שאובמה והדמוקרטים נראים כרגע בעלי יתרון בטכנולוגיית הקמפיין, הייתי מתפלא אם הרפובליקנים לא יתפסו במהירות.
האם אתה חושב שההצלחה של קמפיין מונע נתונים זה פירושה שמנהלי קמפיינים צריכים כעת להיות אנליסט כמו גם אסטרטג?
ייתכן שמנהלי הקמפיין לא צריכים להיות אנליסטים בעצמם, אך עליהם להעריך יותר את האופן שבו ניתן לרתום נתונים וטכנולוגיה לטובתם. קמפיינים השתמשו תמיד במחקרי סקר לצורך ניסוח אסטרטגיה ומדידת סנטימנט המצביעים. אך כעת יש מגוון כלים רבי עוצמה אחרים: אתרי רשת חברתית, מסדי נתונים של בוחרים, סמארטפונים ניידים ושיווק בדוא"ל, כדי לציין רק כמה. וזה בנוסף להתקדמות האחרונה במתודולוגיות סקרי ומודל דעות סטטיסטי. יש הרבה חדשנות בפוליטיקה של הקמפיין האמריקני ברגע זה.
הצלחת לחזות את תוצאות הבחירות 6 חודשים לפני כן, מה לדעתך מסגרת הזמן המרבית הריאליסטית לחיזוי מדויק של תוצאה באמצעות טכניקות הניתוח שלך?
כארבעה או חמישה חודשים הם בערך עד שהמדע מאפשר לנו לעבור ברגע זה; וזה אפילו דוחף את זה קצת. לפני כן, הסקרים פשוט אינם מספיק אינפורמטיביים לגבי התוצאה הסופית: יותר מדי אנשים מתלבטים או שלא התחילו לשים לב למסע הפרסום. הגורמים הכלכליים והפוליטיים ההיסטוריים שהוכחו כמתאמים לתוצאות הבחירות מתחילים לאבד את כוחם החזוי ברגע שאנו עוברים את טווח המחזור של 4-5 חודשים בערך. למרבה המזל, זה עדיין נותן לקמפיינים זמן רב לתכנן אסטרטגיה ולקבל החלטות לגבי הקצאת המשאבים שלהם.
