תוכן עניינים:
בכל יום זורמים ביטים ובתים באוויר ומספקים לעסקים נתונים גדולים. עסקים רבים לקחו את הנתונים הזמינים בחופשיות והשתמשו בהם כדי למקד את לקוחותיהם בדרכים ייחודיות, ולעיתים בלתי חוקיות. זה עורר חששות גדולים לגבי פרטיות מקוונת - או לפחות מה שנשאר ממנה.
עם הדיווחים האחרונים על ריגול ה- NSA על אנשים, צרכנים התחילו להבין עד כמה באמת חייהם "הפרטיים" הם ציבוריים. זה עורר דאגה רצינית בצדק בשוק היום.
הנה חמש מהדרכים בהן נתונים גדולים גורמים לדאגות פרטיות גדולות.
תעשיית הבריאות
ענף שירותי הבריאות היה אחד הדוברים הגדולים ביותר של נתונים גדולים בגלל היתרונות האדירים שיש לו בהגנה על בריאות החולים. תומכי הנתונים הגדולים משתמשים במידע כדי לזהות אנשים עם סיכון גבוה למצבים רפואיים מסוימים בשלב מוקדם, לשפר את איכות הטיפול שמטופלים מקבלים ולהוריד את העלויות הגבוהות יותר ויותר של שירותי הבריאות. (האם האם ביג נתונים יכולים להציל את הבריאות?)
למרות שיש יתרונות אדירים, מחקרים חדשים חושפים כי נתונים גדולים עשויים להיות יותר מסוכנים ממה שחשבו.
לדברי עורך MIT Technology Review הראשי, ג'ייסון פונטין, ככל שהנתונים הופכים נגישים ואישיים יותר ויותר, חשוב להיות מודעים לכל השלכות אבטחה ופרטיות שיש להקל על נתונים גדולים. כללי HIPAA כבר מחייבים אנשי מקצוע בתחום הבריאות להדק את חגורת האבטחה. עם זאת, HIPAA לא יכול להגן מפני כל החששות הקשורים לבריאות. לדוגמה, כאשר אנשים מתחילים לחפש תשובות הקשורות למחלות שלהם באזור שאינו מאובטח HIPAA, כמו גוגל או מנועי חיפוש אחרים, נתונים אלה אינם מוגנים על ידי HIPAA. בנוסף, יותר ויותר מכשירים טכניים, כמו מסכי כושר לבישים ויישומי סמארטפון, אינם מאובטחים או פרטיים, מה שמעלה חשש למי עשוי לראות את הנתונים שמכשירים אלה אוספים.
ישנן דרכים רבות התואמות ל- HIPAA להשתמש בנתונים גדולים כדי לגשת למידע הבריאותי של המטופלים. עם זאת, עם מספר גדל והולך של התנהגויות ומכשירים דיגיטליים אחרים המשמשים למידע ופעילויות הקשורות לבריאות, חלק גדול מהנתונים החדשים הזורמים לשוק ומקוון אינם מאובטחים.
תחזיות ואפליה
בנוסף לחיזוי סיכון פוטנציאלי למצב רפואי עתידי, נתונים גדולים מאפשרים חיזוי של לא מעט מידע אחר על אנשים. הנתונים הגדולים שהמידע יכול לחזות בהם מתפתח יותר ויותר את הפוטנציאל שישמש כדרך להפלות אנשים במגוון דמוגרפיה.
דוגמה אחת לאפליה של נתונים גדולים הגיעה במהלך מחקר שנערך על ידי אוניברסיטת קיימברידג '. לאחר שבחנו בפייסבוק כ- 60, 000 אנשים "לייקים" של אנשים, הנתונים עובדו כדי לחזות דברים כמו מין, גזע, נטייה מינית והתנהגויות. התוצאות היו מדויקות באופן מזעזע. בעת ניתוח הנתונים שנאספו, המודל יכול היה להבדיל במדויק גברים הומואים מגברים סטרייטים 88 אחוז מהזמן. הדגם ניבא גם מירוץ ברמת דיוק של 95 אחוזים. התנהגות, כמו כמות אלכוהול שאנשים צרכו, ניבאה גם במודל זה.
אנשים רבים מודאגים מכך שמעסיקים, בעלי בית, בתי ספר, סוכנויות ממשלתיות ואחרים עשויים להשתמש בקרוב בנתונים כדי לפרופיל אנשים, ויוצרים, בין היתר, פוטנציאל לאפליה על בסיס מגדר, נטייה מינית או גזע. (על סוגיות פרטיות בסיבה מדוע אין זוכים בדיון הפרטיות.)
מכירה מאוד ממוקדת
לאפליה המבוססת על מודלים של נתונים גדולים יש פוטנציאל לחלחל לכל אזורי השוק. בחלק מהמקרים, זה כבר קרה.
באמצעות מודלים הדומים לאלה שבמחקר באוניברסיטת קיימברידג ', משווקים משתמשים בנתונים גדולים כדי למקד את מכירתם ואת מוצריהם. למרות שמשווקים רבים משמשים לנתונים גדולים להצבת מוצרים ושירותים מול קהל ממוקד מאוד, כאשר קהל מחובר ליונים לדמוגרפיה אחת על סמך התנהגויותיהם, יש פוטנציאל לפגיעה.
דוגמה טובה לשיווק מזיק המבוסס על נתונים גדולים קרתה לפני כעשר שנים כשמשתמשי TiVo ניסו לשכנע את מקליטי הדיגיטל שלהם להפסיק להקליט תוכניות שמכוונות לקבוצה דמוגרפית אחרת משלהם. בשנת 2002 אלגוריתמים שגויים אלה תפסו את תשומת ליבו של וול סטריט ג'ורנל. הכותרת המודפסת אמרה את הכל: "אם TiVo חושב שאתה הומו, הנה איך להגדיר את זה ישר."
למרות פוטנציאל הפגיעה, המשווקים עדיין משתמשים בנתונים גדולים כדי למקד לאנשים בפלטפורמות של מדיה חברתית, מנועי חיפוש ובאימייל. הפלישה לתחום אישי כזה על ידי הצגה על בסיס חברים, לייקים ותכני דוא"ל גרמה לדאגה רצינית בקרב הצרכנים.
מעקב מוגבר
לא סתם משווקים מקוונים מעורבים במעקב; כל יום מצלמות מעקב HD מצלמות 413 פטה-מידע. זה צפוי לגדול ל -859 פטיט עד 2017.
מצלמות מעקב צצות כעת בכל מקום. ככל שהאלגוריתמים ימשיכו להתקדם, כמות הנתונים שנוצרת ממצלמות מעקב וחיישנים אלה תגדל גם היא. האחסון בכוננים קשיחים גדל גם הוא במהירות, מה שמקל על אחסון כל הנתונים האלה.
שימוש לא חוקי
עם כמות הנתונים הגדולים שיש לאנשים גישה לימים אלה, אין פלא שחלקם לקחו את הקלות הזו באיסוף מידע קצת רחוק מדי. פרקטיקות לא חוקיות של הקשה על נתונים בדרכים חדשות גרמו להפחדה לא קטנה בקרב אלו המעריכים את פרטיותם.
אחד המקרים האחרונים של עסק שלקח איסוף נתונים גדולים קצת יותר מדי רחוק היה אורבן אאוטפיטרס, שעמדה בפני תביעה בנושא פרטיות ביוני 2013, כאשר התגלה כי קופאי החנות מבקשים מקונים מיקודים כאשר הם שילמו בכרטיס אשראי. זה לא נדרש וזה הפר את חוקי ההגנה והצרכנים ועל פרטיות במדינות מסוימות מכיוון שניתן להשתמש במידע כדי לחפש את כתובות הקונים.
התמודדות עם בעיות ביג דאטה
עם כל כך הרבה פחד וספקולציות לגבי השימוש במידע גדול על ידי חברות, סוכנויות ממשלתיות, מעסיקים ועוד, הפיתרון הטוב ביותר להרוויח אמון בשוק של ימינו הוא להיות כנים. זו הסיבה שעסקים נוקטים יותר ויותר מדיניות שקיפות מלאה לגבי אופן השימוש שלהם בנתונים כדי לכוון את לקוחותיהם. גם לצרכנים יש אינטרס רב יותר לגלות כמה מהחיים שלהם באמת מוצגים ומה האנשים עושים עם המידע שנאסף.
ככל שיותר צרכנים יתחילו ללמוד עד כמה המידע האישי שלהם זמין, ככל הנראה יתקיימו רפורמות בשיטות איסוף נתונים. עד אז, טובת הצרכנים להיות מודעים לפרטיות הנתונים כך שהם מודעים בדיוק לכמה מהמידע האישי שלהם שנאסף וכיצד משתמשים בו. לאחר מכן הם יכולים לנקוט באמצעי הזהירות הנדרשים כדי להגן על עצמם מפני חברות העוקפות את גבולן.
