על ידי צוות Techopedia, 11 במאי 2016
ברק: המארחת רבקה יוז'ויאק דנה בהתקדמות בארכיטקטורת מסדי נתונים ובאחסון עם דז בלנשפילד, רובין בלור ובריאן בולקובסקי.
אינך מחובר כרגע. התחבר או הירשם כדי לראות את הסרטון.
רבקה יוז'ויאק: גבירותיי ורבותיי, שלום וברוך הבא לחברת Hot Technologies משנת 2016. היום אנו, "חושפים בידול: עידן חדש של תשתית מדרגית מגיע." אני נכנס היום לאריק קוואווה. אני רבקה יוז'ויאק, המארחת הצנועה שלך מקבוצת הדירקטורים בזמן שאריק נעדר בג'מייקה. יופי לו.
וכך, כמו שהיה זה עשרות שנים, השנה היא חמה, אם כי אפשר לטעון שהטכנולוגיה נעה בקצב שעולה על החוק של מור, ומה ארגונים עושים כדי לעמוד בקצב? הם מחפשים כל מה שמהיר, וההיקף, לטענתי, הוא כנראה אחד הדברים החשובים ביותר כשאנחנו חושבים על מסדי נתונים. וכמובן שיש לנו אפשרויות למערכת היחסים הרגילה, עכשיו יש לנו את NoSQL שלנו, יש לנו את חנות העמודות שלנו, יש לנו את מסדי הנתונים הגרפיים שלנו, את מסדי הנתונים של RDF שלנו, אבל באמת, מה שעסקים מחפשים הוא בקנה מידה, זה מקביליות וזה מהיר .
כעת, ארכיטקטורות מסורתיות היו מבוססות על אותו מודל יחסי. אבל אם אתה מסתכל על רוב עסקי האינטרנט שצצו בשלוש, חמש, עשר השנים האחרונות, זה לא הדגמים שהם משתמשים בתשתית שלהם. הם משתמשים בארכיטקטורה שונה, ארכיטקטורה מקבילה, הם מגדילים והם מהירים, וזה סוג של מה שהרבה אנשים פונים אליו היום.
ההרכב שלנו, יש לנו דז 'בלנשפילד, הוא מדען מקבוצת בלור. יש לנו את הדוקטור רובין בלור, האנליטיקאי הראשי בקבוצת בלור, ויש לנו את בריאן בולקובסקי, CTO ומייסד חברת אירוספייק. אז חבר'ה עם זה, אני הולך להעביר את זה לדצ.
דז בלנשפילד: תודה, ותודה שהיית כאן. אני מתכוון לנסות ולהגדיר את הסצנה לאיך שהגענו מהר מאוד למקום שאנחנו נמצאים, ואנחנו הולכים לצלול להרבה יותר מהפרטים הטכניים כשאנחנו עוברים על הנושאים של היום. אני רק אשיג שליטה על המסך כאן.
כל כך גדול, טוב יותר ומהיר יותר. כשאני חושב על היכן אנו נמצאים, הדימוי שעולה עלי לראש באופן אישי, זו הדימוי שעשיתי על שקופית הכותרת שלי, שהיא הרחבת היקום. יש לנו טכנולוגיות להתפתח ולצמוח כבר עשרות שנים, למעשה משנות החמישים המאוחרות בהן המיינפריים הפך לדבר אמיתי. הטכנולוגיה המשיכה לצמוח במקרים רבים במצב גרוע או גדול יותר מעקומה ליניארית, תלוי באיזה חלק מהעקומה אתה נמצא, ככל שהתוכנה או החומרה עוברים.
קנה המידה נעשה גדול יותר ויותר, ומהיר יותר ומהיר, ככל שאנו מנסים לספק, וקטן יותר ויותר ברמת הייצור והמוליכים למחצה. ובאמצע יש תוכנה והיישומים והמערכות שעומדות בבסיס התוכנה, והם נוטים להיות קטנים יותר וקטנים יותר, וראינו דברים כמו יישומים עם מיכלים ושרתי מיקרו, זה הפך להיות דבר. עשינו את זה בעבר, עשרות שנים קודם לכן, אבל כתוצאה מהגדלתנו שם וקטן יותר, אנו נהיים יותר ויותר בקנה מידה שנוכל כעת להריץ דברים, כמו יישומים ומסדי נתונים מסוימים, וההיגיון של מסדי נתונים אלה.
יש לי תפיסה זו בה התאמנו אופקית מאוד, בעיקרו של ציר ה- X; דרגנו אנכית בציר Y. אנו נמצאים בנקודה בה אנו צריכים ללכת למקום אחר, ובעיניי זה מעין הנפש הנחשבת כציר Z, וזה שנצטרך להיכנס לעומק הטכנולוגיה ולהסתכל כיצד אנו יכולים לעשות דברים שונים ממה שעשינו עד כה, כדי לקבל את אותה מהירות נוספת. אז אני מדמיין את כל ההתפשטות הזו של היקום, שם התרחש פיצוץ, ויש טכנולוגיות שקיימות, והצמיחה והביקוש הקווים הטובים יותר. היינו צריכים למצוא דרכים שונות להשיג את התוצאה הגדולה, הטובה והמהירה יותר.
רק כדי לכסות במהירות את המקומות שבהם אנו נמצאים כעת בסביבות חומרה מסוימות. ראינו שהעלויות היורדות של ג'יגה-שטח שטח דיסק מביאות לכמה מעברים וטכנולוגיה גדולים למדי, וגישות לנושא הגדול יותר, טוב יותר ומהיר יותר. אלה שני גרפים נפרדים המכסים בערך עשר חתיכות, קצת יותר מעשור כל אחד מהמחיר היורד של ג'יגה-בייט שטח דיסק קשיח.
זה עקומת J קלאסית או מקל הוקי כפי שאנו מתייחסים אליהם לעתים קרובות, מכיוון שלפני זמן מה הייתם יכולים להוציא מאות אלפי דולרים ממש על מנת לקנות ג'יגה-בייט שטח דיסק, לפני לא ממש שני עשורים, בעוד שהיום זה הפך לדולרים ו בסופו של דבר אני בטוח שזה ייגמר, מה שאנחנו מכנים את המירוץ לאפס, הוא יהפוך לסנטים. זה הביא לשינוי מעניין בסוג הדברים שעסקים יכולים לעשות. ואני מתייחס לזה כהפרעה במידע או בנתונים גדולים בפרט, ועל כן, כוונתי היא שראינו טכנולוגיות, כמו להפוך להיות דבר שבו נוכל לשנות מידות אופקיות מאוד באחסון, וסוג המחשוב שאנחנו יכול לחול על אותו אחסון, וכיצד הוא פותח טכנולוגיה מעניינת מכיוון שהוא מאפשר לנו לבצע אחסון מקבילי גדול מאוד ומיותר ברמה הכי מהירה, וחלקים של Hadoop כשלעצמו, באופן טבעי יכולים להעתיק נתונים בפורמט שנקרא פעם אחת בפורמט פעמים רבות ופשוט להרחיב את העניין בכיתה ליניארית כמעט.
וכל החברות כאלו מתגשמות לשיבוש באמצעות נתונים גדולים. יש לנו חברות כמו Uber שהן חברת המוניות הגדולה בעולם. הם לא מחזיקים מוניות ממש, וזו רשימה ארוכה כאן. Airbnb היא ספקית הלינה הגדולה ביותר, ולמעשה אין לה נדל"ן. אחד המועדפים עלי הוא פייסבוק, למשל ברשימה הזו, שם הם לא יוצרים את התוכן בפועל, אנחנו יוצרים עבורם את זה, אבל הם למעשה בעלי המדיה הגדול ביותר בעולם. יש לנו כאלה מעניינים כמו הבנקים הצומחים במהירות, למעשה אין להם כסף. אלה הן פלטפורמות ובנקים להלוואות עמית לעמית, ויש אחת באוסטרליה בפרט שזוכה לתהילה ההולכת ונקראת SocietyOne. וכמה מהבנקים הגדולים שכן חייבים לקבל מזומנים משקיעים בבנק ההוא-לעמית-הספציפי הזה. ואנחנו עוברים את הרשימה הזו אפילו עד נטפליקס; הם אינם בבעלותם אף בתי קולנוע ובכל זאת הם למעשה בית הקולנוע הגדול ביותר בעולם.
אז הם הגיעו למקום שהם היו, לטעמי, באמצעות יישום טכנולוגיות חכמות ברמת הנתונים, מכיוון שנוכל לבצע אחסון גדול ורחב יותר בעלויות נמוכות יותר בגלל המחיר הנמוך של ג'יגה-שטח שטח בכונן הקשיח, ויכולנו ליישם כמה מחשבים אינטליגנטים ולהפיץ מודל מחשוב על זה. לחברות אלה הייתה היכולת ליצור יתרון תחרותי ולשבש כתוצאה מאותן ירידות בעלויות שטח הדיסק.
ראינו שדבר דומה קורה בעלות הזיכרון. לפני כמה עשורים, אם היו שישה מיליון דולר שוכבים מסביב, הייתם יכולים לקנות גיגה-בייט של זיכרון RAM, והיה לנו עקומת J דומה או מקל הוקי, תתבצע בהפחתת העלויות או במחיר הנמוך של RAM. וזה הביא כמה דברים מעניינים, ובעיניי, אחד השיבושים הגדולים ביותר במרחב הזה הוא כמות הזיכרון שיכולים להיות מובנים במכשירים, כמו מכשירים ניידים, כמו טלפונים וטאבלטים, ואפילו מחשבים ניידים. מחשבים בימינו, כמות הזיכרון שנכנסת למחשב נייד ממוצע זה די מגוחך במקרים מסוימים. במקרים מסוימים, למחשב הנייד הנוכחי שלי יש יותר זיכרון מכמה מהשרתים שהם השתמשו בהם לפני זמן לא רב.
זה הביא לשינוי משמעותי בזכות עצמו, בצורה דומה לזו של זיכרון RAM לדעתי, זה איפשר לנו להתאים את גודל הגודל במהירות. ועכשיו הייתה לנו הופעה של טכנולוגיה שאנו מכנים פלאש, וזו טכנולוגיה שבמקור נובעת ממשהו שישב על חומרה בצורה של EEPROM, שבב קטן שתוכנן להיות מסוגל להיות זמין, ולכתוב אליו, ואז בדיוק כשהכוח כבה זה ישמור את כל מה שכתבת לשבב הזה כאחסון מתמשך. זה היה איטי, זה היה מגושם ובאותם ימים, אני חושב שזה היה בערך 1980–1981 זה נהפך להיות דבר. עד 1984 טושיבה שלדעתי המציא את הטכנולוגיה הפכה אותה לדבר מסחרי שנוכל להשתמש בו.
אך לא מעט זמן, אנשים חשבו שהם יכולים לקחת שילוב של רכיבים ששימשו ליצירת מושג זה של EEPROM, זיכרון לקריאה בלבד, ברגע שהוא מחק אותו ונכתב אליו, והם יוכלו למעשה לכתוב לו על בסיס קבוע, והשתמש בו קצת יותר כמו שטח דיסק, וקצת יותר כמו זיכרון RAM. עם הזמן זה התפתח. כעת טכנולוגיית אחסון הפלאש הזו מהווה מיזוג בין אחסון דיסק מסורתי, בין אם מדובר בדיסק מסתובב ובמקרים מסוימים דיסק זיכרון היברידי, לבין זיכרון RAM. ודבר המפתח הוא המערכת בין כי אתה יכול לקרוא ולכתוב לה, ואז לכבות את הכוח, והיא תשמור על מה שכתבת לה. אז שטח דיסק, ברור שאתה כותב אליו, אתה מכבה את הכיבוי, ואת ציר הספינינג והמעודן בכבדות, מחמת תיאור טוב יותר, שומר על האפסים ואלו שכתבת לו.
במרחב הזיכרון בגישה אקראית אתה כותב זיכרון משהו בזיכרון RAM, אתה מכבה את המחשב והכל נמחק כי אין יותר אלקטרונים כדי להחזיק אותו טעון ולהחזיק את המידע שכתבת לו. בנוסף זה באמצע וזה מהיר ביותר, מהיר יותר מהדיסק, מעט איטי יותר מ- RAM. אבל אתה יכול לכתוב לזה, ולקרוא ממנו, וכשתכבה את הכוח, הוא יימשך. זה הביא כמה טכנולוגיות מדהימות ובמיוחד פיתחנו מכשירים ניידים ומחשבים ניידים שהם ממש ממש מהירים ומסוגלים לעשות המון דברים, ועכשיו זה מועבר לחלל התשתית סביב אחסון ומחשוב וזה הביא משמעותי שינויים במה שאנו יכולים לספק בקנה מידה. זה המקום שבו אני מאמין שציר ה- Z במוחי מתרחש עכשיו.
זה כמעט בדיוק בזמן במובנים רבים, מכיוון שראינו כעת שיבוש במה שאני מכנה ביקוש, וזה שלצרכנים יש, בלי קשר למה שקורה בתשתית ובמרחב הטכנולוגי, ויכולת לנהוג מהר יותר ומחשוב מהיר יותר וביצועים ברמה התשתיתית, הצרכנים דורשים את ההפרעה הזו בצורה של מה שמכונה כעת, חווית הסלבריטאים. כולם רוצים שכל מערכת, כל אפליקציה, כל אתר ויידעו מי הם ומה הם אוהבים, ולהיות מסוגלים להעניק להם חוויה אישית אחד על אחד. זה כבר לא מספיק טוב רק ללכת לאתר בו אני קונה כרטיסי קולנוע. אני רוצה שהוא יידע מה קניתי בעבר, למה קניתי את זה, וייתכן שאנשים בדיוק כמוני קנו וממליצים על דברים.
באופן בלתי הפיך, אנו רואים שהדבר שאני מתייחס אליו הוא סדר לוואי של חברתי, וזה שאני רוצה את חווית הסלבריטאים, אבל אני גם רוצה לחבר את הרעיון הזה, אני רוצה לשתף אותו עם כל החברים שלי ולספר להם מה אני אני עושה, ואני גם רוצה לדעת מה החברים שלי עושים. וזה תוצאה של דרישה מתפרצת למחשבים ואחסון נוספים, ומהפך מהיר של הדברים. ראינו את דור Fitbit, מה שאני מכנה מעקב תמיד. כל מה שאני עושה מתעד, נרשם ונלכד איפשהו. ראינו הכל בזמן אמת: בנקאות, הצעות מחיר, מנועי המלצות, צורך להיות מסוגלים להתמודד עם דברים בזמן אמת שאני אישית עושה כצרכן.
ואז אנו רואים השפעה גדולה מאוד, כמו סיכוני האבטחה סביב אבטחת סייבר. פעם היו לנו האקרים בודדים, ואז היו לנו כנופיות פליליות שמיישמות את עצמן על זה, עכשיו יש לנו אומות שלמות שיוצאות למלחמה באינטרנט, וזה דבר אמיתי וזה קורה. שימו לב לזה, שבו ותביטו בזה, כי יש לכך השפעה אמיתית, וכמה מהמרבבים שקדמו לתצוגה לפני כן היו סביב הדיון בסיכון להיכנס למחשב שלכם, או לפחות לרשת שלכם.
ראינו מושג זה של מיצוי ישויות. מיצוי ישויות הוא כאשר עלינו למצוא דברים מעניינים בתוך מערכי נתונים גדולים מאוד ובעיקר סביב הונאה, ופעילות בלתי חוקית וסוגי האקרים. אך לרוב נראה כי מיצוי ישויות הופך להיות נקודת מיקוד לדברים טובים, ודברים שיש להם ערך, לעומת חיפוש אחר דברים שתוקפים אותנו.
ראינו גם פיצוץ, מה שמכונה נתונים גיאוגרפיים. אלה נתונים שלמעשה יודעים מאיפה הם מקורם, או מאיפה נתונים אחרים כמוהם. אתה יכול לדמיין שאתה עומד ברחוב ואתה רוצה למצוא את תחנת החניה הקרובה ביותר, או את המסעדה הקרובה ביותר, יישומים שיכולים להחיל מחשוב גיאוגרפי ומידע, מחשוב לנתונים, שיודע איפה הוא נמצא בחלל, הם חשובים מאוד מכיוון אתה צריך להיות מסוגל לדעת היכן נמצאים חפצים וישויות אחרים ולעשות זאת במהירות.
ראינו ניידים המחוברים לצמיתות. אפילו כשאנחנו הולכים לישון בלילה, הניידים שלנו עדיין מתקתקים, מעדכנים את המיילים שלנו, בודקים את היומנים שלנו, מסתכלים על מזג האוויר ונמצא מה יהיה מה שנרצה לארוחת הבוקר. קורה שם הרבה רעש, וזה יצר השפעה מאסיבית על מה שאנחנו צריכים לעשות בקצה האחורי, וכמה מהר אנחנו עושים את זה.
בסך הכל, היקף ההשפעה העצום של מה שמכונה אינטרנט הדברים, או לעיתים קרובות יותר, קישוריות בין מכונה למכונה, שם מכשירים מדברים עם מכשירים וזה עובר את כל המנועים הרצועים אל בצד של המטוסים שאומרים למטוס עצמו, או למערכת ניהול המטוסים, כי המניע במנוע מספר ארבע חווה שחיקה וחום מוגזמים, ויש להחליפו כשאנחנו נוחתים, ואז הוא מתקשר למכונה אחרת, ולכן עליו למקם סדר, ובאופן קסום מופיע מהנדס בטיסה בשדה התעופה ומוכן להחליפו במהלך התדלוק.
והקנה המידה שהוא כל כך גדול וכל כך גדול שנאלצנו להיכנס למה שאני מתייחס אליו, דרך גישה לסוג ההתמודדות עם זה. כי עולם חדש, וברוך הבא לעולם החדש, עולם חדש של כל מה שאנחנו משתמשים בו מחוברים; פעם זה היה לוויינים ומכשירי רשת, עכשיו מדובר במכשירים ניידים ובמחשבים הניידים והטאבלטים והטלפונים שלנו, ואפילו לאאודי החדשה שלי יש שלט מובנה בתוכו, והיא מדווחת כל העת על בריאותה שלה, אך גם מעדכנת את עצמה, ויודע איפה זה, ואילו מפות חלות, ואפילו אומר לי מתי לעבור מסלול אחר אם יש תנועה בדרך לפנינו.
כל מה שאנחנו בונים עכשיו, כל מה שאנחנו מדברים איתך עכשיו, מתוכנן להתחבר ולהתחבר לדברים אחרים, לא רק ממני למערכת, אלא ממערכת למערכת, ולהיות מסוגל להתמודד עם זה שאנחנו עלינו ליישם חשיבה שונה מאוד בשכבת התשתית, הן בחומרה והן בתוכנה, ובמיוחד בשכבות מסד הנתונים שמערכות צריכות לבסס זאת, ובמובנים רבים המאגר הפך להיות המנוע, והאפליקציות באמת רק בוטים קטנים שעושים דברים.
אני מתכוון להתארגן כאן במהירות עם התצוגה המעט הומוריסטית הזו לגבי סוג המקום שאליו אנו הולכים עם הדברים האלה, ולדבר שאני מכנה "IoT בלחיצת הכפתור." נוצר גאדג'ט חדש שנקרא כפתור דאש של אמזון, וזה גאדג'ט קטן בגודל האגודל. למעשה במובנים רבים זהה לכונן האגודל USB שלי. כשאתה קונה את הדבר הזה, זה בערך 4.99 דולר ארה"ב באינטרנט מאמזון, הוא נשלח אליך, אתה מגדיר אותו עם הטלפון הנייד שלך ואתה פשוט מחבר אותו באופן מילולי לאחד המכשירים שלך, כמו מקרר או מכונת כביסה או כל דבר אחר. בדוגמה של מכונת הכביסה, אם בסופו של דבר ייגמר לך אבקת הכביסה, אתה יכול ללחוץ על הכפתור הזה והוא יחייג הביתה ויוזמן אוטומטית יותר עבורך, ובאופן קסום יותר יישלח אליך דרך החברים הטובים שלנו באמזון.
מבחינתי זה מפחיד אותי, כי זה הולך לראות פיצוץ של מספר דברים שמחוברים ברשת וניסיון ליצור קישוריות, ולייצר ביקוש. אם אתה יכול לדמיין, אחד או שניים מהדברים האלה הם אולי לא כל כך מפחידים, אבל בפעם האחרונה שהסתכלתי, היו יותר מ -110 מהדברים האלה ממותגים, כך שכמעט כל מותג על פני כדור הארץ הולך לנסות להשיג את הדחיפה הקטנה שלהם- כפתור IoT, שתלך הביתה ותלחץ על כפתור ואומר "תזמין לי פיצה." אתה לוחץ על כפתור אחר וזה מזמין ארוחת צהריים שנבנתה מראש לילדים שלך לבית הספר מחר.
זה מניע דרישה כה ענקית לשינוי בקצה האחורי, ברמת היישום, ובמיוחד ברמת מסד הנתונים, שלדעתי רק ראינו את קצה הקרחון של סוג הטרנספורמציה של הביצועים שאנחנו צריכים לראות . ועם זה, אני הולך למסור אותו לדוקטור רובין בלור ולקבל את התובנות שלו לגבי סוג של מקום בו אנו נמצאים, גם כן.
רבקה יוז'ויאק: אוקיי רובין, העברתי לך את הכדור.
רובין בלור: זה לא טוב? אוקיי, הנה, זה אני. ראיתי את המצגת של דז לפני שהגעתי לפרצוף הזה, אז הייתי אומר דברים שהם מחמיאים יותר מאשר רק לחזור על כמה מהדברים שאמר דז. חשבתי שאדבר על אבולוציה של בסיס נתונים במונחים של מה שקרה בפועל לארכיטקטורה, וכן הלאה, וכן הלאה, על בסיסי נתונים מנקודת מבט היסטורית.
הבעיה הבסיסית שיש לכל ספק של מסד נתונים היא שמירה על ארכיטקטורה גמישה המדרגת את הקצב עם ההתפתחות בחומרה. אני אדבר חשבתי על זה, אבל כשאתה בעצם מסתכל אחורה ורואה את הדרך בה נבנו בסיסי הנתונים, ואת האופן שבו הם בנו עכשיו, הם למעשה שונים באופן משמעותי ממה שהייתי מכנה רמת העיצוב האדריכלי. . שווה רק לבדוק מדוע זה, או לפחות אני חושב שכן. גורמי החומרה ו- Dez העניקו לנו סקירה טובה במיוחד של השכבות התחתונות מבחינת הזיכרון והדיסק. מה שיש לנו עכשיו וזה העתיד הקרוב, אינטל היא הבאה, CP שעתיד להיות עם FPGA עליו. מה אנשים הולכים לעשות עם זה, אין לי מושג. AMD ממזג מעבדים ו- GPUs ומה ההבדל הזה יעשה? אלה הם סוגים של שינויים שבאמת ישפיעו על בסיס הנתונים, ואני חושד ש- Aerospike בין היתר, מכיוון שאירוספייק מונע על ידי ביצועים, זה כנראה כבר מסתכל על זה ומבחן לאן היא חושבת שהיא באמת הולכת ללכת עם הדרך בה המוצר עובד.
יש לנו מערכת בשבב שעדיין לא המריא. נתוני SSD שאנחנו יודעים עליהם, אבל הנקודה היא שהם למעשה גדלים במהירות, בערך שיעור החוק של מור, גורם של 10 בכל שש שנים. אבל אינטל עומדת לשחרר נקודת חוצה תלת מימדית, שטוענת שהיא מסוגלת ללכת פי מאה מהר יותר מ- SSD, למעשה סוג של טיפות לתערובת, אז זה הולך לשנות את המהירות שבה מוצרים כמו Aerospike יכולים למעשה ללכת.
ואז יש לנו את ארכיטקטורות החומרה המקבילות, או במילים אחרות הדרך שבנינו חומרה במובן של - במקור זה היה רק מעבד שישב מעל הזיכרון, שישב על גבי דיסק, אבל זה הפך להיות מסובך הרבה יותר מזה. הרעיון של מערכת בשבב הוא שבאמת יכול להיות לך שבב מקבילי לשבב לשבב ולגרום שהכל יעבור במהירות יוצאת דופן, ואין לנו שום מושג במדויק אילו מהמוצרים האלה באמת ישתלטו.
זו רק מבט לעתיד, אבל ברמת החומרה הביצועים מואצים והעלויות ממשיכות לרדת, מעין הקווים שדז תיארה. המעבדים שלך לא בהכרח זולים יותר, הם פשוט מקבלים מהירות יותר וכן הלאה.
מנקודת המבט העסקית, במצבים מסוימים, ומדובר במצבי שוק, היותם הראשונים הם המקום בו הערך העסקי הוא. אם אתה במיוחד - אם אתה משוכנע לחלוטין שמלאי מסוים הולך לרדת במחיר, האדם הראשון שמקבל את הזמנת המכירה מקבל את המחיר הטוב ביותר. זה באמת כל כך פשוט. לפיכך, ישנו מרוץ טכנולוגי העובר למסחר אוטומטי בבנקים כדי לנסות ולנצח במצבים אלה. מה קרה אחרי זה? מה קורה לאחר שהבנקים עשו את שלהם עם כל זה? פתאום אתה מתחיל לראות אזורים אחרים נדבקים באותו סוג של צרכים למהירות.
מה שבאמת קרה, האם בני האדם הוצאו מהמשוואה, וזה קרה בפרסום באינטרנט מהר מאוד. אבל העניין היה, זו לא העסקה הספציפית, ביצוע שיטות, זהו תהליך עסקי שלם, זו העובדה שדף האינטרנט נזרק זה עתה, ויש לקבל החלטה שעשויה להיות החלטה מסובכת למדי, באיזו פרסומת אמורה לשים בדף אינטרנט זה, ומסיק מכל מי שמשתמש בדפדפן הוא מהי המודעה המתאימה ביותר להעלות את זה וכן הלאה וכן הלאה. זה הפך לדבר מורכב מאוד, ואני אזכיר זאת שוב.
אבל העניין הוא שהביצועים והדרגיות של התהליך העסקי, הם לא אותה בעיה כמו ביצועים ומדרגיות של יכולת שאילתה, וזה משהו שאני יודע היטב, בגלל חדר התדרוך שעשינו לאחרונה עם Aerospike שהם אתה גם מודע אליו. דבר נוסף, כשאתה בעצם עובד במהירויות האלה, נכסי נכסים חשובים לעסקה, כל עיבוד אירועים. הם באמת, באמת חשובים. אז הרבה מאוד מה שמסדי נתונים מסוימים עושים, שמאבד מכתב או שניים מנכס, עשוי לעבוד בצורה סבירה בהקשר - זה יעבוד טוב בהקשר שאנחנו מדברים עליו. זה לא ממש מקובל, אם להיות כנה.
מנקודת מבט טכנולוגית אתה בעצם מסתכל - אני יודע שיש שני סוגים של מינוף, על מנת ליצור את סוג האדריכלות שנדרש למעשה לספק את המהירויות שיכולות לעשות, כמו אירוספייק, יכולות לבצע מיליון עסקאות לשניה. אתה צריך להיות מדויק מאוד מבחינת פיתוח התוכנה. אתה לא יכול פשוט לפרוץ. אתה צריך להיות מודאג מאורכי נתיב הקוד. אתה צריך לעשות שימוש מצוין בזיכרון, ולמעשה אתה מבצע אופטימיזציה של עסקאות שלמות. אתה צריך הקבלה אינטליגנטית ואתה גם זקוק להקבלה של כישלון בטוח. אתה צריך להתפשט יותר מאשר לא להתפצל, מכיוון שברגע שאתה מערב את הרשת בכל דבר, הוא הופך להיות המצביע הסביר ביותר אליו אתה מתכוון לחביון, והוא יתחיל להפוך את העסקאות לאטיות מדי.
אתה צריך לעלות כמה שיותר על כל נתון שידוע ברשת לפני שאתה באמת מתפנה, ואתה באמת לא רוצה להתפנות במהירות, אתה באמת לא רוצה תהליכים רבים. אתה רוצה רשת שלא משתמשים בה על ידי אף אחד אחר. ואתה רוצה שתהיה רשת מהירה להפליא.
אחסון SSD מואץ הוא משהו - למעשה אני חושב שרוב זה תקף למה שאירוספייק עושה. אחד הדברים המעניינים הוא שזה מסד נתונים של NoSQL. פעם האמינו - אני לא יודע, לפני מספר שנים - פעם האמינו שמסד הנתונים ההתייחסותי היה המאגר היחיד והוא שלט בכל דבר, וזה היה רק מצבי נישה קטנים ומוזרים זה שלא הייתם צריכים ללכת להתייחסות. זה סוג של ראש מופנה עכשיו. זה מסדי הנתונים המהירים שנמצאים על בסיסי נתונים אלה של SQL, ואחת הסיבות לכך, הסיבה העיקרית לכך, היא שהם נמנעים מהצטרפות לנתונים, הם מאחסנים נתונים בצורה די אובייקטיבית. כשתסיים עם אובייקט אתה פשוט אוחסן אותו ואז אתה מושך את כל האובייקט לאחור, זה לא מחבר דברים כדי לעבד אותם בפועל. זה מה המהירות סביב. סוגים אלה של טכניקות המייצרות מהירות בהקשר של מסד הנתונים.
זה שובל הדמעות, זהו זה, מה שקרה למאגר. הסיפור או הסיפור של מאגרי המידע ההתייחסותיים היה סוף מסד נתונים שלמעשה לא היה נכון. גם כשהתחילו להגיע לדומיננטיות, זה עדיין היה נחוץ. מסדי נתונים של אובייקטים ביצעו את העסקאות שחלפו בעבר באותם הימים, מכיוון שמאגרי מידע יחסיים למעשה לא יכלו לבצע אותם, ואז התברר שמסדי הנתונים היחסים המשתמשים בחנויות שורות, הם גם לא יכלו לבצע שאילתות מהירות, אתה זקוק לחנויות עמודות. ואז גילינו שאם אתה באמת רוצה לבצע שאילתות גרפיות על נתונים, לא חנות עמודות ולא מסד נתונים יחסי לא יהיו טובים, ולמעשה היית צריך לבנות עבורך מסד נתונים מודע לתרשים. ואז נכנסו מסדי נתונים של RDF, וברגע שהתחלת באמת לקחת בחשבון את המשמעות של סמנטיקה וקיבלנו את מסדי הנתונים של NoSQL, מאוד מאוד ספציפיים למהירות. לקרוא להם NoSQL זה כמעט כאילו אתה ממותג את כל בסיסי הנתונים האלה כאילו הם זהים, למעשה הם שונים באופן קיצוני במה שנמצא מתחת. הסיבה היחידה שהם נושאים את השם NoSQL היא שהם לא נותנים לעזאזל SQL כי זה יקר מדי. זמני ההעברה שהם זקוקים להם.
ה- IoT - שחשבתי שאגמור באותה נקודה בה דז סיים את זה - זה לא נגמר, כל המצב הזה מבחינת המהירות ודרישות ההשהיה, זה לא נגמר עד שהגברת השמנה תתחיל להתעלם מהנתונים האלה והם עדיין לא ממש התחילו. חלק גדול מהנתונים האלה ירצו להחזיק את ההשהיות שהייתי מציין עליהם, אז אני חושב שזה כל מה שיש לי לומר. בואו נמסור את זה לאירוספייק ולבריאן בולקובסקי.
בריאן בולקובסקי: היי, תודה רבה שהצטרפתם לקבוצת בלור ולעצמי על המצגת הזו היום. כשחשבתי על מה דז ורובין בדיוק דיברו, ברצוני לספר לכם קצת על המסלול שאירוספייק ביצעה לספק טכנולוגיות מסדי נתונים חדשות וטכנולוגיית מסדי נתונים NoSQL למספר תעשיות. זה היה מסלול נהדר. התחלנו את אירוספייק בשנת 2008 לראות הרבה טרנדים שדז ורובין הזכירו. באופן ספציפי לגבי מסדי נתונים בזיכרון היכולים לנצל את הפלאש, כמו גם את סוג מערכות הענן המתרחבות, ואת סוגי הסקאלה הנדרשים כדי לבצע התאמה אישית, ניתוח התנהגות וסוג חוויות ה- VIP של ידוענים שנדונו.
כשניגשנו לבעיה של בסיס נתונים שהיה בסיס נתונים תפעולי מקדימי שיכול לספק את הבסיס ליישומים שניתן היה לכתוב כדי לפתור אותם, התחלנו בבעיה כיצד נוכל לבנות בעצם טבלת חשיש מבוזרת, זיכרון טבלת חשיש שהופצה הייתה מהירה להפליא ומסוגלת לדברים כמו מיליוני עסקאות בשנייה, אך במחיר סביר. כשסיימנו את האב-טיפוס שלנו, הבנו שאז נצטרך להבין מי עשוי להזדקק למהירות מסוג זה. בהיותנו חברת עמק הסיליקון, מהר מאוד גילינו שמדובר בתעשיית הפרסום שמסוגלת לצרוך מידע מסוג זה ומעוניינת בו, ולכן הייתי רוצה להקדיש שנייה לדבר על הצעות בזמן אמת ואיך זה שוק עובד.
רובין הזכיר כיצד פועלת המסחר הפיננסי, שהיא העסקה הראשונה היא לעיתים קרובות העסקה המנצחת, ובעצם יש זמן לשוק של זמן החביון וערך לחביון. ענף הפרסום שונה במקצת, באופן מעניין, מכיוון שהמטרה בפרסום היא מסוימת - מה שנקרא רושם, היכולת להציג מודעה - היא מכירה פומבית, והמכירה הפומבית נמשכת בין עשרה אלפיות עד חמישים אלפיות השנייה. שם המשחק, ולעתים קרובות יש מאות חברות המציעות בזמן אמת על כל מודעה שמוצגת באינטרנט, הוא להשיג את כמות הנתונים המרבית ולהביא את האלגוריתמים הטובים ביותר שיש להם בתוך עשרה עד חמישים אלפיות השנייה. כמות הנתונים הגדולה ביותר.
השינוי והמעבר הזה התרחשו בענף הפרסום, בכל אחת מאותיות האלפיות הקטנות, יש סיבוך מוגבל בזמן עם האלגוריתמים הטובים ביותר על פני כמות הנתונים הגדולה ביותר, וכדי לעשות זאת אתה מאגד הרבה חתיכות קטנות של נתונים. מידע עדכני על כתובות IP, מידע עדכני על קטגוריית מכשירים מסוימת, מידע עדכני על התנהגות אתר, מונחי חיפוש אחרונים, הכל ייכנס לרוטב הסודי של אלגוריתמים של חברה מסוימת כדי לקבוע מחיר והצעה.
זה היה שוק מרתק להיות חלק ממנו. ביצענו לראשונה את הפריסה הראשונה שלנו ב- Aerospike בשנת 2010 עם כמה מהחברות הראשונות שעבדו ברצינות בתוך כלכלת הצעות המחיר בזמן אמת, ואז השגנו, בעצם היותה חנות חזיתית של נתונים התנהגותיים, עבור רוב החברות בה שטח. מה שמצאנו מאז, והוא ארכיטקטורה מסוימת עליה אפרט במהלך המצגת הזו, זה שהכל התרחש בשנת 2010, 2011, 2013 וממשיך להתפתח. פרסום הוא שוק דינאמי מאוד.
אבל חוויה כזו מסוג VIP, אתה יכול לחשוב עליה כמי שמציב את המודעה הנכונה, לא מציב מודעה למוצרי ילדים של ילדים, מכיוון שבמקרה אין לי ילדים, אז לא תהיה לי מודעה אפקטיבית אם זה מונחת על זה, אבל אם מדובר במכוניות מהירות, זה סוג המודעה שיש לבריאן. זו באמת סוג של חווית VIP במבצעים, האם להנחות או לא, אם אתה נמצא באתר קמעונאי, אפילו בזיהוי הונאה. האם זה הדפוס הרגיל של אדם מסוים, או כרטיס אשראי מסוים? כל אותה צורה של טכנולוגיה של ניתוחים בזמן אמת, של חיזוי התנהגותי, של ניתוח חזוי, מחלחלת כעת מתעשיית הפרסום, שעושה את זה בשביל הכיף והרווח עכשיו כבר לא מעט שנים, ובאמת נכנסת לקמעונאות. וגילוי בנקאות והונאה וכו 'באמצעות ארכיטקטורה מסוימת. אז אירוספייק זכתה להיות חלק ממספר מהמקרים.
הארכיטקטורה שאנו רואים עובדת והיותה פרקטית לשם כך, היא כזו שבמקום ליצור קבוצה של שאילתות משרת יישומים, במקום להעביר יותר מחישובך לשרת האפליקציות עצמו, ואז להשתמש בבסיס נתונים כאחסון בעצם. מנוע לסוג החפצים שרובין דיבר עליהם. במקרה זה, הארכיטקטורות האלה, ראשית, לא מבלבלות את זה עם הניתוחים האמיתיים שלך כאן. אתה רואה בצד ימין של השקופית הזו שעדיין יש כאן ניתוח לניתוח תובנות. מדובר בעבודות שלעתים קרובות עובדות על פני פטיט, עשרות פטה-בייט של נתונים, ואפילו אקזבייט במקרים של חלק מהלקוחות הגדולים שלנו, תוך שימוש במגוון טכנולוגיות. אתה צריך להיות צוות נתונים גדול, צוות ניתוחים, צוות כמותי שם כדי להבין מה, נאמר, קואורדינטות גיאוגרפיות חשובות, אילו דגמים עובדים מבחינת מציאת מערכות יחסים אלו ויצירת חווית ה- VIP. זו בעיה שלמה בפני עצמה ולא כזו שאירוספייק השתתפה ישירות בה, ויש חבורה של טכנולוגיה נהדרת כשאתה מתמודד עם מערכת כזו.
מה שהתלהבנו ממנו ועבדנו עם הענף הוא שברגע שיש לך את התובנות האלו, איך אתה עוסק בסוג של מכונה למכונה או מהירה בין מכונה לאדם, איפה אתה לוקח את התובנות האלה ועושה הם אמיתיים לכל אדם, רגע אחר רגע? הארכיטקטורה שראינו שמשתמשת בה היא כזו שבה יש שרת יישומים שנכתב והיא עושה את כל המתמטיקה ההיא ומסתכלת על המודלים שיצרתם, ובוחנת את ההתנהגות האחרונה ועושה זאת על פני בעצם פרדיגמת מפתח או לפחות סוג של מערכת שאילתה מאוד.
כשאתה מתמודד עם סוגי סוגי הנתונים שאנחנו מדברים עליהם, סוג הזרימות שאנחנו מדברים עליהם, עם מיליוני כתבים בשנייה, מיליוני קריאות בשנייה, מיליונים ומאות ואלפי החלטות בשנייה שנית, בניית אינדקסים מורכבים, אינדקסים רב ממדיים, פשוט לא עובד טוב במיוחד, זה לא ניתן להרחבה. הדרך להשיג צורה זו של סולם היא ליצור הרבה מקבילות. נדבר קצת על איך אנו עושים זאת בהמשך. אבל חלק מזה הוא שרת אפליקציות חסר מדינה שנכתב בשפה שלך.
מה שאנחנו רואים לעתים קרובות הוא פרויקט מסוים בהנחת מסגרת יישומים חדשה המבוססת על האנשים שעובדים שם, הטכנולוגיה בה הם משתמשים והבעיה שהם מתקרבים אליהם. ראינו אנשים שמשתמשים בפייתון, הרבה אנשים משתמשים ב- Java, אנחנו עדיין רואים מתכנתים C, מכיוון שהרבה מזה עדיין ביצועים גבוהים, אולי אפילו משתמשים בדברים כמו ספריות MATLAB הישנות. והם צריכים לגעת באלפי אלפי נקודות נתונים בשנייה כדי לקבל החלטה אפקטיבית.
שאלה אחת ששאלתי לפעמים היא "ובכן, בריאן, אם אתה מסוגל למיליוני עסקאות בשנייה, מי צריך את זה?" אם אתה מסתכל למשל על עיבוד תשלומי צפון אמריקה, ו- Aerospike מעורב ב פתרונות שעושים איתור הונאה במערכת ההיא, ותומכים בכותבי יישומים שעושים כמה דברים חדשניים ביותר בזיהוי הונאה, יש רק אלפי כמה עסקאות תשלום בשנייה הזורמות אפילו דרך גדולי מעבדי התשלומים. ובכל זאת, כאשר החברה הראשונה הגיעה אלינו ואמרה שהם בוחנים להשתמש ב- NoSQL, ורצתה לראות איך ייראה הפיתרון שלנו בבסיס האפליקציה שלהם, הם אמרו שהם רוצים לגעת ב -5, 000 פיסות נתונים בחלון של 750 אלפיות השנייה. ובכן, פתאום יש לכם כמה מאות עסקאות עסקיות וכמה אלפי פיסות נתונים שיש לקחת בחשבון בכל חישוב, ועכשיו אתם נמצאים בתחום של צורך במיליוני עסקאות בשנייה.
המקרה של - השבת פרסום לרגע, המקרה של הונאה מרתק מכיוון שבמקום שיש כסף, יש הונאה ומניעה הונאה בזמן אמת, בניגוד לנסות למיין באופן אנליטי אחרי שקרה הונאה, הוא באמת עניין להביא באינטרנט כמה שיותר נתונים, ותוכלו לחשוב על זה כהשתקפות של חוויית ה- VIP ההיא. האם אדם זה מתנהג באופן שהוא בדרך כלל לא מתנהג? וכך, הסיכוי שזו תהיה מערכת הונאה, ולא למעשה האדם הזה, עולה. האם אדם זה בדרך כלל ניגש דרך מכשיר מסוים או קבוצה של מכשירים, עם קבוצה מסוימת של רזולוציות מסך? האם הם בדרך כלל מציגים דפוס קניות התנהגותי מסוים? אולי נוכל לפטום הונאה באיבו במהלך העסקה עצמה. זה אמור להזכיר לך מאוד את סוג הדברים שקורים בעסקה במערכת הפרסום.
סוגי המערכות שאנו פותרים הם כאלה שבהם לכל מעבד תשלומים בנפרד יש צוות נתונים גדול, יש להם הרבה נתונים היסטוריים, הם יוצרים דגמים חדשים, הם לא משתפים אותנו ב- Aerospike בכל הדגמים, מכיוון שהם אני באמת רוטב סודי. אם אתה מנוי לגרטנר ושמעת את גרטנר מדבר על כלכלת האלגוריתמים, זהו אלגוריתם אחד וחברה אחת שנלחמת ראש בראש בכדי להפיל הונאה ולהעלות את מספר העסקאות המוצלחות, מכיוון שאתה גם לא ' אני לא רוצה לחסום עסקאות. זה סוג הפרויקטים שאנחנו מחפשים ב- Aerospike ברמות גודל אלה.
מקרה נוסף שעבדנו עם חברות שירותים פיננסיים הוא מה שמכונה מערכת התקליטים של היום. במקרה זה, מה שקורה הוא, סוג החוויה העשירה יותר, אפילו במערכת מסחר קמעונאית, היא כזו בה אני רוצה להיות מסוגל להתבונן בעמדה המסוימת שלי ואני רוצה לעשות זאת בצורה מדויקת ביותר. אני לא רוצה שיהיה לי מלכוד מול מערכת ה- DB2 שלי. במקום זאת, אני רוצה להסתכל על הנתונים המדויקים, ובין ניידים, אבל גם דברים כמו חישוב מחדש של סיכון, עכשיו יש לבצע חישוב מחדש של סיכון על דקה אחר דקה, אתה רוצה להיות מסוגל לחשב מחדש את הסיכון של כולם, כמו גם הסיכון הגלובלי, הסיכון המערכתי על פני כל החברה תוך מספר דקות.
ושוב, זו אותה בעיה. כל חשבון בודד שהוא מסוים, חשוב עליו לחפש ערך מפתח לאובייקט מסוים, ואז ניתן לעשות זאת במקביל, והכי חשוב, פרדיגמה זו מאפשרת לך לכתוב את הקוד ואת האלגוריתמים שלך בשפה ברמה גבוהה, שקל יותר לבצע ניפוי באגים וזמן מהיר יותר לשוק. בכלכלת האלגוריתמים הזו אני צריך להיות מסוגל להשיג את האלגוריתמים שלי ברשת. זוהי בעיה שונה מאוד עבור דוגמנות וקשרים עסקיים, וזה מה שמערכות יחסים נהדרות בהן. כשיש לך טבלת חלקים, והחלקים האלו קשורים להזמנות, וההזמנות האלה קשורות לאנשים, יש לך תהליך עסקי שניתן לעצב בצורה מדויקת וכנראה שלא ישתנה לאורך כל חיי העסק שלך. עם זאת, אלגוריתם חדש למציאת דפוס הונאה חדש צריך להיות כתוב במדויק ובמהירות, ולהגיע לאינטרנט, ולקבל החלטות עסקיות תוך כמה ימים לכל הפחות, אם לא מהר יותר. פיתרון NoSQL למערכת רשומות מהסוג הזה הוא באמת מערכת מדהימה עבור החבר'ה האלה, מכיוון שהיא מאפשרת להם להכניס נתונים מהר מאוד, כמו גם לבנות אלגוריתמים חדשים, כך שלא רק חווית לקוח חדשה בפנייה למובייל, אלא באמת בונה מגוון רחב של יישומים חדשים.
מה שאנחנו רואים בטווח הארוך ב- Aerospike הוא העובדה שלכל סוג בסיס נתונים, לכל מערך נתונים פיזי בדיסק יש רכיבים משלו, ובאיירוספייק אנחנו באמת מתמקדים בערך המפתח או במערכת המכוונת לתפקיד הזה, כמו שרובין אמר, עם עקביות גבוהה של עסקאות, ומאפשרים לאנשים כמו חנויות עמודות ואגמי נתונים בנפח גבוה, כמו גם מערכות עסקיות הארדקוריות שגם להן היו מגבלות דיווח. אנו רואים את כולם צריכים להזין מגוון מנועי שאילתה שונים. אנו רואים כמה ממנועי השאילתה מבוססי JSON. אנו רואים דברים כמו חיפוש אלסטי, אנו רואים את ניצוץ, כולם זקוקים לזנים שונים בזמנים שונים של דברים כמו חנויות עמודות, כמו גם חנויות שורה, ושם מצטיינת אירוספייק.
אנו באמת רואים שהסוגים השונים והתעשייה הללו מגיעים לנקודה בה הבחירה במיטב הגזע מכל אחד מאלה תהיה הכרח. לרוע המזל, בגלל המציאות של ניתוחים ארוכי טווח ועבודות קבועות עם פסוקי אנליטיקה ואילוצים תפעוליים, ככל הנראה לא נגיע לנקודה שיש גודל אחד, מתאים לכל אחד, אך נגיע לנקודה של היכולת לבחור בבירור בין כמה ממערכי נתוני הליבה.
בואו נדבר לרגע על חידוש הפלאש. אני עדיין מקבל את השאלה, למרות שכפי שהוסבר קודם לכן, הפלאש איתנו כבר זמן רב. כאשר התחלנו את Aerospike בשנת 2009 היה זה, אני מאמין 2009, אולי, כן, 2009 היה כשאינטל יצאה עם ה- X25, שהיה באמת כונן הבזק המאויש הראשון של SATA המאוורר בשוק, והיו מספר מערכות פלאש לפני כן, אבל באמת זה היה זה שפרץ לתודעה רבה של טכנולוגיה. Fusion-io באמת הביא פלאש לשוק הארגוני הרחב אחרי זה.
מה שקורה עכשיו הוא הופעתה של מערכת בשם NVMe. NVMe הוא תקן הדומה ל- SATA או SAS או אפילו SCSI המאפשר לספקי כרטיסים שונים לתרום פעולה עם מנהלי התקנים במערכת ההפעלה ברמת יעילות גבוהה. אז זה יוצר רמה גבוהה יותר של ביצועים, קודם כל מכיוון ש- NVMe מבוסס על PCIE כתעבורה הבסיסית, שהיא מהירה בהרבה מ- SATA, SAS או כל דבר אחר, אך גם היא מאפשרת נהגים מיטב הגזע.
למשל בלינוקס יש את הבחור הזה ג'נס, וג'נס הוא מדריך הנהגים של NVMe, אקספו של ג'נס, והוא עושה עבודה טובה יותר ממה שכל אינטל או Fusion-io היו יכולים לעשות עם הנהג האישי שלהם, עם כל המשאבים שלהם. כאשר יש לך את הכוח של מערכת ההפעלה עצמה לבנות את מנהל ההתקן הטוב ביותר, אנו רואים כמה רמות ביצועים מדהימות באמת. כל זה מגבה את הרעיון שהפלאש באמת יכול לספק הרבה זמן החביון הנמוך של RAM.
כעת, אירוספייק היא עדיין מסד נתונים RAM נהדר בגלל מודל האשכול שלה, עם זאת, אנו מגלים שברגע שאתה עושה הופ רשת, שאתה צריך לאחסון ניתן להרחבה, אתה כבר מוציא לפחות חמש עד 50 מיקרו שניות, תוספת של 70 מיקרו שניות של NAND היא לרוב לא מכשול, ואתה יכול באותה מידה להשתמש בפלאש, בהתחשב בפלאש ה- NAND, בהתחשב בכך שהרשת כבר מעורבת בכך. אנשים רבים תוהים אז איך - כל זה נשמע נהדר אם אתה קונה חומרה משלך, איך העננים הציבוריים מסתדרים? אני חושב שתמצא כרגע, לא משנה באיזה ענן ציבורי אתה משתמש, לעננים הציבוריים האלה יש הצעות פלאש חזקות מאוד. זה כן שונה מעט מספק ספק לענן. לאמזון יש מקרים של I2 שיצאו לדעתי כבר שנה, שנתיים, שהם באמת פלאש באיכות גבוהה למדי, ול- Aerospike יש את תבנית הפריסה מעליהם.
ברצוני לקרוא ל- Google Compute, Google Compute Engine, Google Cloud באופן ספציפי מכיוון שבניסיון שלנו עד כה יש להם כמה מהמכשירים בעלי הביצועים הגבוהים ביותר וכמה מהגמישות ביותר מבחינת דפוסי הפריסה. אבל גם אתה רואה דפוסי פריסה חדשים כמו Pivotal, שהוא סוג של ציבורי / פרטי, כך שתוכל לעשות אפליקציות Pivotal נכונות בשני המקומות התומכים בפלאש ותומכים במכשירי אחסון שונים כמו גם בדפוסי Docker. אז באמת, זו נקודה בהיסטוריה בה הפלאש לא רק זמין עבורך לקנות ולהכניס למרכזי הנתונים שלך, אלא שבאמת שקע בכל ספקי התשתית, כי זו באמת הדרך הטובה ביותר להשיג מערכות IOPS גבוהות ב חביון סביר מאוד.
רק רגע אחד על אירוספייק - אירוספייק הוא מסד נתונים מבוזר באשכול, מה שהופך אותו לנוח מאוד לפריסה בסגנון ענן כמו גם למרכזי נתונים. אנו מגלים שגמישות היכולת להוסיף עוד נתונים וביצועים נוספים היא הכרחית בהחלט בסוגים אלה של יישומים חדשים נטו כיוון שאתה מתחיל פרויקט, אינך יודע אם אתה זקוק לחמישים אלף עסקאות בשנייה, מאה אלף, מיליון, שני מיליון, אז אתה רוצה לתת לעצמך מרחב כושר ביכולתך להוסיף שרתים. ובכל זאת, אתה רוצה להתאים את גודל הגודל כך שכל שרת יוכל להיות מהיר בכוחות עצמו. אתה לא באמת רוצה בסופו של דבר עם חמש מאות או אלף שרתים שהם שרתי מסד נתונים איטית. קנה מידה בחוץ הוא לא המשחק היחיד בעיר, ההיקף והגודל שלו, כמו שאמר דז 'קודם לכן, יש ציר Z חדש.
אני מקווה שזה נותן לך כמה רעיונות חדשים לגבי האופן שבו המהירות והקנה מידה פונים לשווקים חדשים ואולי יש פרויקטים שאתה עובד עליהם שבהם תוכל לשקול באמת לבנות יישומים עשירים יותר ולהשתמש במסגרת יישומים עם מפתח יותר ערך או מסד נתונים NoSQL מתחתיו. ב- Aerospike בהחלט ראיתי הרבה לקוחות שלנו והרבה ממשתמשי הקוד הפתוח שלנו מצליחים עם הדפוס הזה, ואני מצפה לתעשייה לאמץ אותו במידה רבה יותר.
רבקה יוז'ויאק: תודה רבה לבריאן, ואני בטוחה שלדז ורובין יש כמה שאלות טובות עבורך. רובין?
דז בלנשפילד: אני שמח לקפוץ פנימה. רובין, יש לך שאלה? אחרת יש לי מהיר שאוכל להתחיל.
רובין בלור: סליחה, הייתי אילמת. צללתי פנימה, אבל איש לא שמע אותי. מיד עלתה בי השאלה, מכיוון שמדובר במערכת יכולות טכנולוגיות מאוד מתוחכמות. מבחינת הלקוחות הקיימים שיש לך, מה סוג ההסלמה או שיעור העסקה שאתה חווה לגבי חלק מיישומי מודעות אלה? האם שיעור העסקה ממשיך לעלות? ואם כן, באיזה סוג שיעור?
בריאן בולקובסקי: שאלה מעניינת, רובין. לכל ענף יש עקומה משלה בכל חברה. בואו ניקח פרסום בצפון אמריקה, נניח שבשנת 2012 הפרסום בצפון אמריקה התקרב ככל הנראה ל -200, 000 מודעות בשנייה, מעין תוך-יום רגיל, לא הזמן שלי, ועכשיו הוא הסלים ככל הנראה לכשלושה עד חמישה מיליון מודעות בשנייה. אבל אז קרה דבר מעניין. תעשיית המודעות החלה להתייחס לחששות הונאה, וחלקי התעשייה שמצליחים לחסום הונאה, ראו שיעורי עסקאות נופלים מעט, בערך גורם של שניים, בקרב חלק מהלקוחות המתוחכמים שלנו שהצליחו לקבוע הונאה. כמובן שהם נאלצו לבצע בדיקות מסדי נתונים כדי לחסום הונאה, כך שבסופו של דבר זה יהיה דומה.
מקרה שימוש מעניין הוא בתחום הטלקום, לא ממש ציינתי את זה, טלקום ראתה כי עסקאות גדלות עקב חיוב המבוסס על כל מנות בודדות שעוברות ברחבי רשת הטלפונים הסלולריים. בימים עברו התקשרנו לרשומות מפורטות ופעם בדקה, שיחה, מה אתה יודע, קצת פינג היה עובר ברשת והאם הבחור הזה עדיין נותר לו דקה? עכשיו עלינו לבנות ואפילו לנתב בהתבסס על כל מנות באינטרנט. זהו סליחה ברשת סלולרית, שפתאום מסתכמת במיליוני מנות בשנייה ומשהו שגדל שוב ושוב. אז מקרה אחד הוא שכל יישום הוא נהיגה של סוג קטן ונחמד של 2X בשנה. בקרב לקוחות מסוימים אנו רואים, "אבל רגע, יש לי אפליקציה חדשה. אני רוצה להוסיף קצת הונאה לסיכון שלי. אני רוצה להוסיף חווית לקוח עמוקה יותר להונאה והסיכון שלי. "כל אחד מהם יוצר עומס חדש על בסיס הנתונים הבסיסי.
רובין בלור: כן, אני מתכוון שאני חושב שזה מה שרמזתי במצגת הקצרה שנתתי, שאלו - פעם חשבנו שעסקה היא, מישהו עושה משהו ואולי יש מפל של אירועים והכל מתועד, ועכשיו להרבה עסקאות יש כמות עצומה של חיפושים, וניתנת כמה דוגמאות במצגת. ולכן אינך מבצע עוד עסקה, אתה למעשה מבצע סוג של אפליקציה שיכולה להכיל אלמנטים רבים ורבים בה.
השאלה האחרת לפני שאני מוסר לדז - מכיוון שברור שאנחנו מתייגים על זה צוות - השאלה השנייה שהייתי רוצה שתענה אם יש לך תשובה סבירה לכך, היא גם דז ואני מצפה שהאינטרנט של דברים, או האינטרנט של הכל כפי שהוא מכונה לפעמים, כדי ליצור כמות דרמטית למדי של תנועה עסקית. אתה יכול לדבר עם זה? האם זו החוויה שלך, האם יש לך לקוחות שמגיעים אליך עם סוג מסוים זה, ומה דעתך על זה כרגע?
בריאן בולקובסקי: בטח, אני חושב שיש קצת בלבול, וזה בלשון המעטה, בנושא האינטרנט של הדברים. הלקוחות שאני רואה עד כה פשוט מביאים את האינטרנט לדברים שיש להם. חשבו על הכפתורים האלה של אמזון - הכל אמזון - הכפתורים האלו, אתם לא יכולים לעשות בהם שימוש מחדש ולגרום להם לעבור לוולמארט ברשת. זה לא כמו דפדפן שאתה יכול לערבב ולהתאים לכל דבר. מצד שני, מכונה למכונה קורה, וכשאתה מחבר את המכונית שלך לטסלה כדי לטעון אותה, טסלה שולחת זרימה אחורה של מידע, כל חיישן בודד למכונית, אבל זה זורם למחשב של טסלה לניתוח ומשופר איכות. מה שאני רואה הוא שכל המכונה למכונה, וכל החיישנים בתוך חברה פרטנית, ויוצרים דרישות חדשות.
עכשיו בעיקר היום, זה זורם למערכות אנליטיות אלה, וקח את המקרה של טסלה; השימוש הראשון של טסלה בזה, להבנתי, היה בשיפור חיי הסוללה, תחת "אילו טמפרטורות תפעוליות הן, מהן העומסים? בואו נסתכל על זה, בואו נתכנן סוללה טובה יותר. "אבל אז הם מתחילים לחשוב, וזה הכל נהדר. זו סוג של בעיה אנליטית עמוקה שמרתקת. השאלה הבאה היא" איך אני משפר את החוויה ברגע אחר רגע. ? "
עכשיו בואו ניקח את המקרה כמו קן, שם אתה מנסה לעשות ניתוחים חזויים כדי לשנות את הטמפרטורה של הבית רגע אחר רגע. זה מסוג המקרים שבהם אנו מתחילים לראות ב- Aerospike, שם יש את אגם הנתונים הענק הזה ויש תהליכים אנליטיים אדירים זה, אבל מה אני הולך לעשות עכשיו? אני אצטרך לשמור, לחשוב על זה כמו המזומנים, חלק מהשבוע האחרון, החודש האחרון, אולי אפילו רק מידע שווה את היום האחרון, כנראה בקצה אחורי מכיוון שיש לנו חיישן פשוט מכשירים, ואני הולך לעשות סט אנליטיקה באותו רגע לרגע כדי לשנות חוויות. חוויות דומות לקן, כאלה שאני רואה במקרים של אירוספייק משתמשים בהן.
רובין בלור: אוקיי, הדבר שציפיתי לו עם האינטרנט של הדברים היה שתתחיל לקבל מפעילי סף ושהם יתחילו ליצור מפל של אירועים. ראית משהו כזה, או שזה לא משהו שראית עדיין?
בריאן בולקובסקי: דז ואני היינו - רק שאלתי את דעתו של דז על כך כשהיינו מקדימים צ'ט. מה שעוד לא ראיתי הוא סוג המפלים של נתונים של חברה אחת שמתפללים בחברה אחרת, שהמקרר של סמסונג שלי מדבר עם מכונת הכביסה של LG שלי כי זה פשוט מצאתי ששפכתי חבורה שלמה של שוקולד על כל הרצפה, אז סוג כזה של חברה לחברה מכשיר אחר מכשיר, אני חושב שאני עדיין מחכה לזה מבחינת Internet of Things. אני חושב שיש כמה בעיות בעסקים ובביטחון שרובם לא טכניים שצריך לענות עליהן בכדי לראות זאת.
רובין בלור: אוקיי, דצמ?
דז בלנשפילד: יש לי כמה דעות מאוד חזקות על אותה נקודה אחרונה בדיוק, שאני פשוט תכניס בקצרה לשיחה. אני חושב שלעיתים קרובות עסקים וטכנולוגיה חושבים שהם למעשה נוהגים לאן שהביקוש מגיע, אבל כשאנחנו מסתכלים על מה שקרה כשהאייפון הפך להיות דבר, ובעיניי זה היה סוג של המכשיר הנייד הראשון, אם תסלח משחק המילה, אבל מכשיר שאפשר לסחוב אותו שיכול באמת להריץ הרבה אפליקציות קטנות בכיס שלך, וזה הביא לשינוי משמעותי במה שחשבנו להיות מחשב. הרבה אנשים חושבים על מכשירי אייפון או סמארטפונים, או על טלפונים אנדרואיד כטלפונים, אבל הם לא, הם בעצם רק מחשב קטן שמריץ אפליקציות, ואחת מהאפליקציות שהוא מפעיל מבצע שיחות, והן לא שיחות שאנו חושבים עליהן יותר, הן אינן שיחה אנלוגית מנקודה לנקודה כפי שהדגיש בריאן, הן מנות קטנות שמנותבות.
אבל לעתים קרובות יותר מאשר לא, מה שראינו הוא ההתמחות הזו של הטלפונים החכמים למעשה לא משמשים לביצוע שיחות שלעתים קרובות, ההסתברות 98% ממה שאני עושה בסמארטפון שלי זה לא שיחות. זה הכל חוץ משיחות, זה אפליקציות. אני חושב שהאפקט המפליא הזה - ואני מעוניין להביא את זה לשאלה במהירות - אבל האפקט המדרדר למעשה נוצר על ידי הצרכנים, ולמעשה יש לי אניה אחת זו שאני מוציא לעיתים קרובות למדי כדי להשיג חבורה של CXOs לשבת בחדר ולשים לב אם אני חושב שהם נרדמים עם המצגת שאני עושה, שלא קורה לעיתים קרובות מדי, בתקווה.
אני די אמרתי את זה בשיבוש שאתה רואה בעסק שלך למעשה לא מונע על ידי טכנולוגיה בלעדית, זה לעתים קרובות יותר מאשר לא מונע על ידי הלקוחות שלך. והם די מתיישבים ולמעשה תוהים, למה הוא מתכוון שם? אז כשאני חושב על השימוש בטכנולוגיה, אני מתכוון שראינו USENET, ראינו כל מיני דברים מהנים שקורים באינטרנט, אבל לא הרבה אנשים חזו חברתית, ואת ההשפעה של זה. כולם רוצים לספר לכולם מה היה להם לארוחת הבוקר, והרעש שיצר וטכנולוגיית ה- backend שהיה לנו, ואז כמובן הפרסום מנסה למלא את הדברים בדברים.
אני חושב שאנחנו הולכים לראות השפעה מדורגת עד לנקודה בה מכשירים מדברים עם מכשירים, הצרכנים פשוט מביאים מה זה אומר בעצם ומה זה יכול לעשות. העלית נקודה מעניינת סביב הסיבה שכפתור אמזון לא ידבר עם וולמארט. אני מתכוון לפרסם את השאלה הזו, מה קורה כאשר וולמארט יקבל כפתור משלהם, ואז מה אם עשרים האמזונות והוולטארים המובילים ורשתות הפצה וקמעוניות גדולות אחרות יקבלו כפתורים משלהם? לאן זה לוקח אותנו? באופן ספציפי, שאלתי עם בריאן עומדת להיות, "לאן אנחנו הולכים עם פרדיגמת הביצועים החדשה הזו? אתה נמצא בקצה המדמם ואתה עובד עם חברות שעושות את זה גם ברמת התשתית הפיזית וגם ברמת העברת הנתונים. לאן זה לוקח אותנו, כשמגיע הגל הגדול הבא הזה? איזו תובנה אתה יכול לחלוק סביב זה עם מה שקורה בנדנד מהניסיון שלך? "
בריאן בולקובסקי: בטח, הדרך שבה אני חושב על הרבה מהדברים האלה היא להתמקד בחוויות המשתמש ובדברים בדיוק שאמרת, המשתמשים הם אלה שמניעים, למרות שטכנאים ואנשי עסקים אנו עשויים למצוא רעיון חכם שאנחנו חושבים שהמשתמשים אוהבים, ואני אחזור בדוגמה לקן. כשאחותי התקינה את קן בביתה, היא אמרה, "הבית שלי שקט יותר, אני יכולה לשמוע דברים. זה אפילו לא סתם שאני משלם פחות על הכוח, "היא כן, אבל עכשיו אתה לא יכול לקרוע את הקן הזה מהידיים שלה כי היא אוהבת להיות בבית שקט יותר לעומת אחד בו החימום מתפוצץ לכל היותר ואז לכבות שוב.
בסופו של דבר השאלה היא מהן חוויות המשתמש שנוכל להעצים? זה בסופו של דבר, אותה חווית איכות חיים, שאם יהיה לנו את הכסף ואנחנו בעולם הראשון, היינו משלמים עליו הרבה. אני אתן לך דוגמא מהבית שלי, חברה שלי אוהבת חלב קר. היא אוהבת חלב קר באמת, ולעתים קרובות כל כך עלינו לנסות להבין איפה במקרר הולך להיות קר מספיק, ולא לשאר הדברים יתר על המידה. ובכן זה נהדר - ואמרתי לחברתי, "האם היית משלם 10 דולר לחודש בכדי שיהיה חלב קר ולא שיהיה לו נקניקים קפואים?" היא הייתה כמו "בהחלט." ומוציאה 10 דולר לחודש מכל צרכן. קשוח.
אני חושב שבחוויות האלה אנחנו באמת צריכים לפקוח עין מהי אותה חוויה סוף צרכנית שבאמת יכולה להיות מונעת. אני חושב שזה היה חלק מהסוד של האייפון. אני חושב שזה חלק מהסוד של טסלה לבנות מכונית טובה יותר עם כל הנתונים, לבטל את הרעיון של מחזור מוצרים ושחרור שנתי ולעשות שיפורים מתמשכים על כל חלק. נצטרך לבוא עם כמה רעיונות חכמים כיצד להשתמש באמת בכל הנתונים האלה באופן שמשכנע רגע אחר רגע לחייהם של אנשים.
דז בלנשפילד: כן, זו תובנה נהדרת. להמשיך הלאה מזה, הקצה השני של הספקטרום, שמהדהד בדיוק עם מיני הדברים שאנחנו רואים עכשיו עם מה שהצרכנים מבקשים, ולכולנו יש משהו בבית שקורח מזה וחם מזה. הקצה השני של הספקטרום הוא אם כן, ואנחנו ראינו את זה במעין "עולם הנתונים הגדול" המסורתי בו הקצאות נתונים הופכות נדירות יותר משיניים של תרנגולות ואלו שנמצאות בשוק מוצעות יותר ממה שמפקחי הרשות הרוויחות מרוויחות. במקרים מסוימים, סוגי החברות שאתה עובד איתן וסוגי הפיתוח שראית, האם זה המקרה שסוגי המפתח וסוג אדריכל הנתונים ומומחי הרשת, האם הם מתקשים יותר ויותר למצוא אותם ? האם אנו זקוקים לארגונים שיתחילו לחשוב כעת על הקדימה של עקומת סוג המיומנות שהם צריכים בקצה האחורי עבור סוג המפתחים ואדריכלי הנתונים? מה אתה רואה ברמה כזו, ככל שמשאבי המיומנות שהם יבינו כיצד להשתמש בטכנולוגיה זו לשימוש טוב כעת נראה?
בריאן בולקובסקי: כן, אני חושב שזה אחד האתגרים שעומדים בפני הארגונים שדיברתי איתם. בין אם זה - הבעיות הגרועות ביותר ששמעתי עליהן הן למעשה חברות גדולות יותר, כי אם אתה אומר "אני מהבנק הגדול הזה, אני מצ'ייס והייתי אדריכל נתונים", אז אתה יש לך את הצדפה שלך בעולם והמשכורת שלך עולה, אז יש בעיית הנטישה הזו של קבלת עבודה באחד המקומות האלה כי אין מספיק אנשים ואז להיות מסוגלים לעבור מעבודה לעבודה. אני לא שומע דבר מלבד בעיה כזו, וזו בעצם אחת הסיבות לכך שמיקדתי את Aerospike סביב שימוש בכלי עבודה שמתאים לצוות הפרוייקט המסוים.
במקום לנסות להיכנס לצוות פרויקטים ולהגיד, "היי, אתה צריך להשתמש בשפת השאילתה שלנו." תראה, אם החבר'ה האלה, הם נוהגים באוטובוס בימינו, חבר'ה וכאלה, ואם הם משתמשים בשפת שאילתה מסוימת. וכלי עבודה הם הולכים להישאר בזה, ואני לא יכול לדבר עליהם לשום דבר אחר. המטרה שלי היא להציב את סוג הכוח של Aerospike כמסד נתונים שמאחורי כלי העבודה שהם משתמשים וזה חלק מהרעיון הזה, השקופיות שאתה רואה לגבי עתיד מסד הנתונים של Poliglot. אני צריך לתמוך בדפוסי היישום והניתוח בין החבר'ה האלה, כי באמת קשה לנסות למצוא אנשים שיש להם רקע מתמטי כמו גם את היכולות הסטטיסטיות לנווט בעולם הזה.
דז בלנשפילד: דבר מעניין נוסף שאנשים אולי לא מודעים אליו, אני מתכוון שאירוספייק הוא שחקן חזק מאוד בעולם הקוד הפתוח, אני מעוניין לקבל תובנה מהירה מאוד לגבי סוג זה אומר עד כמה העסק פועל ומה הוא עושה בשבילך. הזכרת שעבדת ישירות עם אנשים שעושים דברים ממש עד לרמת הגרעין בפנים, אז גרעין לינוקס. יש כמה שחקנים גדולים שנמצאים בחלל הזה, ויש כמה מותגים מפורסמים שלא נזכיר, אבל ארגון כמו אירוספייק, בהיסטוריה העכשווית המודרנית שלך, חוויית הקוד הפתוח, איך זה נכנס לתמונה הגדולה ואיזה יתרונות תחרותיים ראית שנותנים לך?
בריאן בולקובסקי: בטח, כשעברנו למקור פתוח בשנת 2014, עשינו את זה כי הבנו שתשתית ליבה, כמו מסד נתונים צריכה להיות זמינה במקור, צריך לסמוך עליה ואיזון נגדי טבעי בין העולם הישן של הסגור מקור, וברגע שאתה משקיע במאגר מסוים, החבר'ה האלה רחמים לך למחזור הטכנולוגיה אחרי מחזור הטכנולוגיה, וצריך להיות איזון. עלינו להיות מסוגלים להוציא גרסאות שעושות דברים חדשים, ואולי זה בגרסה ארגונית, עלינו להיות מודל רישיון כפול שיש בו גרסת קוד פתוח לאנשים הבועטים בצמיגים שעושים עבודה ללא מטרות רווח., כמו גם גרסת ארגונים שהיא רישיון בעלים ומאפשרת עבודה ללא הגבלה.
וכמובן שתהיה לנו גם הרמות הגבוהות ביותר של מהירות וקנה מידה, בהיותנו גרסה ארגונית. אנו מאמינים במודל רישיון הדו-קרב וזה היה נהדר עבור העסק שלנו. אנחנו רוצים שאנשים יתחילו לעבוד עם אירוספייק, אנחנו רוצים פרויקטים קטנים לבעוט בצמיגים, זה קל מאוד פשוט ללכת לאמזון, להפעיל תסריט אישור ולהפעיל אשכול אירוספייק תוך חמש דקות. מצד שני, אנו רוצים לתת יותר ללקוחות הארגוניים.
דז בלנשפילד: אנחנו די מתקרבים לראש השעה, אז אני אחזור לרבקה בעוד רגע, אבל אם היה שם רק אונייה אחת שתזרוק שם, סוג העצה הייתם נותנים לאנשים שמחפשים להיכנס לחלל הטכנולוגיה שהבאתם לשוק ואיך הם הולכים לאמץ את זה, מה הייתם אומרים שהצעד הראשון עבורם הוא סוג של לפחות טבילה שלהם ולהתחיל להסתכל איך הם הולכים להשיג יתרון תחרותי מהפלטפורמה שלך?
בריאן בולקובסקי: בטח, חלק מההודעה כאן היא שיש רמות מהירות ומיומנות שהן קלות עכשיו. אינך זקוק לאשכול קסנדרה בעל אלף צמתים בכדי להשיג מיליוני עסקאות בשנייה. אתה יכול לעשות את זה אפילו בשלבים הראשונים של הפרויקט שלך. אז הדברים הרבה יותר קלים מבעבר. ואז העצה השנייה היא שתצטרך להמציא, ממש כמו שאתה אומר, מודלים של לקוחות עסקיים במתמטיקה של תהליכים עסקיים המשתמשים בכל הנתונים האלה, כך שהחדשות הטובות הן שהנתונים זמינים, חדשות רעות הן שלמעשה עליכם למצוא כמה דפוסים ובמקרים מסוימים שימוש משכנע.
דז בלנשפילד: כן, עצה נהדרת, אז אני אחזור לרבקה עכשיו. תודה רבה לך על זה, זה היה צ'אט קטן נהדר על הטכנולוגיה, אני מעריך את זה.
רבקה יוז'ויאק: תודה, דז. יש לי כמה שאלות טובות מהקהל. תני לי לזרוק את השקופית הזו. אני יודע שדיברת על מערכת התקליטים והמיינפריים, אך באיזו תדירות אתה רואה פריקה מוחלטת או שכפול זה פיוס סוף יום, סוג של מה שאתה רואה יותר?
בריאן בולקובסקי: מה שאנחנו רואים ב- Aerospike משתמש בבסיס נתונים של NoSQL מול אותה מערכת פיוס סופית. אתה צריך תוך יום יום, התשובה הנכונה. לא תוכל לקבל את התשובה הלא נכונה, וזה מה שרובין אמר על נכס אינו מוערך, אך התהליכים העסקיים סביב הדרישות החוקיות של פיוס עלולים להסתבך למדי ויש עשרות שנים של טכנולוגיה ועשורים של עבודות משפט ומשפט סביב ביצוע פיוס. אז מה שאנחנו רואים ב- Aerospike הוא שאתה הולך לעשות את האלגוריתמים שלך במסד נתונים חם יותר עם יותר עסקאות בשנייה. אך מסיבות משפטיות אתה זקוק לחלוטין למערכת פיוס שעברה תהליכים משפטיים אלה. אנו רואים את שניהם, ואנחנו רואים שזה בעצם הנוהג ה- IT הדו-שכבתי שנחשף לאנשים מסוימים כמו אנדרסון ייעוץ וגרטנר. אנו רואים הרבה מזה.
רבקה יוז'ויאק: אוקיי, טוב. מישהו אחר גילה עניין בשקופית הספציפית הזו, הוא אמר שזה ממש מעניין ותהה אם אתה יכול פשוט להיכנס קצת יותר להשוות פלאש לעומת זיכרון.
בריאן בולקובסקי: בטח, ובכן תן לי לקחת פס צד מהיר, שוב, אני יודע שאנחנו קרובים לסוף הזמן. ובכן פלאש הוא זיכרון - זה שבבים - אני נוטה לחשוב על זיכרון RAM. אז ל- RAM יש מאפיינים מסוימים, דורש הרבה כוח, זה טוב מאוד בכתיבה אקראית כמו גם בקריאות אקראיות. איפה ש- NAND מסוגל לקרוא קריאות אקראיות במהירות ולהוריד כוח, אבל זה רע מאוד בכתיבה אקראית. ישנם כמה הבדלים עדינים באופן שבו שני השבבים הללו פועלים ברמה הליטוגרפית, שיוצרים מספר הבדלים טכניים.
במקרה בו אתה מבצע ניתוחים ואתה צריך לדלג על הרבה נתונים, או במקרה של Aerospike, שם קיבלת אינדקסים, אינדקסים עדיין טובים מאוד לשימוש ב- RAM בגלל מקבילות וגישה אקראית. דרושה רמה גבוהה יותר של גישה אקראית. ב- Aerospike אנו מוצאים כי באמצעות אינדקסים אלה כדי למצוא אובייקט מסוים או נתח נתונים, זהו המקום המתאים להגיע אל NAND מכיוון שהוא הופך להיות סוג של חנות גדולה יותר מתחת לאינדקסים. זוהי פעולה אחת להתקן אחסון, אך עדיין לאחר ביצוע הרבה פוטנציאלים ומסננים במערכת האינדקס שלך.
רבקה יוז'ויאק: אוקיי, טוב. ואז, אני יודע שדיברנו הרבה על ה- IoT והערת משתתפים אחת אמרה כי IoT מועיל במידה רבה, אך האם חברות, גופים ממשלתיים ומפתחים צומחים בצורה מאובטחת ומאבטחים נתונים באותו קצב, אתם חושבים?
בריאן בולקובסקי: אולי דז, תרצה לקפוץ פנימה?
דז בלנשפילד: כן, אני שמח לקפוץ לזה. אני חושב שהתשובה היא לא. למען האמת, אחד הקווים הזורקים החביבים עלי בנושא זה מאוד מאוד קצר הוא שאני חושב שהתפוצצות מכונה למכונה ואינטרנט כללי של דברים, תקשורת וביטחון, הסיכון סביבו, אנחנו בנקודה בה ממשלות לא יכולות לעמוד בקצב השינוי. ובעצם אנו יודעים שהרבה ארגונים לא יכולים לעמוד בקצב השינוי. למעשה, אם פרפראזתי את זה, קצב השינוי כיום הוא כה גדול עד שהארגונים נאלצים לרוץ רק כדי להמשיך, אבל הם צריכים לרוץ בסיבובים מרוצים. אני לא חושב שהחוק ואני לא חושב שהממשלה בכלל, ברמה המדינתית או הפדרלית, מסוגלת לעמוד בקצב השינוי.
העצה הכללית שלי לאנשים היא מעשה עכשיו ובקש סליחה אחר כך. היו דוגמאות רבות לכך בעבר. הם יתעדו, אבל אני חושב שזה באמת שעומד על ספקי העסקים והטכנולוגיה לחדש את המרחב הזה ולהבטיח שאנו מכירים את סיכוני האבטחה או סיכוני הפרטיות ואנחנו צריכים להתמודד עם אלה. בנקים בפרט, כפי שציינת, כשאתה חושב על מה שארגון בנקים עשה באופן מסורתי בדברים כמו הלבנת הון ומכיר את הלקוח שלך, אתגר AML / KYC, פעם זה היה כל שלוש עד חמש שנים שהיינו מנסים ולעמוד בתאימות.
עכשיו אני חושב שצריך להיות מובנה בכל עסקה יחידה. תמיד הצלחת לעשות זאת ברמת ההצעה באמצעות פרסום ומסחר במניות ובאג"ח ומניות, אני חושב שאנחנו בנקודה בה הביצועים שאתה מביא עם פלטפורמת Aerospike מאפשרים לנו כעת לחשוב איך אנו מביאים פרטיות, כיצד אנו מכניסים ביטחון לאותה שרשרת החלטות מיידית בזמן אמת? וכך התשובה היא לא, אני לא חושב שממשלות ממשיכות לעמוד. אני חושב שחברות צריכות לעמוד בקצב, ואני חושב שאנחנו צריכים לפעול עכשיו ולבקש סליחה אחר כך.
בריאן בולקובסקי: הרשו לי להוסיף גם כמה נקודות. החבר'ה שאני מתמודד איתם, חברות הטכנולוגיה שאני מתמודד איתם, מודעים מאוד לוודא שהם בצד הימני של החוק, וכמות נכונה מהדיון היא האם ה- PII הזה, האם אוכל להשתמש בזה, איך אני אני משתמש בנתח הנתונים הספציפי הזה? מה הייתה ההשגחה שלה והאם זו החלטה או חוויה מוגנת? איך אני עושה את כל זה? אז אלה החדשות הטובות. לפעמים אני תוהה על הדיון שלנו כחברה שאליה אנו פונים, ואם אפילו הדיון בחברה שלנו הוא ברמה המתאימה מבחינת השימוש ביכולות החדשות מ- IoT עד ללימוד מכונות, וזו הדרך היחידה כדי למיין את נפחי הנתונים שיש לנו. אבל החדשות הטובות הן שהחבר'ה שדיברתי איתם באמת נמצאים בצד הימני של ניסיון לעשות נכון לפי ההחלטות המשפטיות שקיבלנו.
רבקה יוז'ויאק: אלה כמה תשובות ממש טובות משניכם, ואני מסכים לחלוטין. אני לא חושב שהביטחון נע בקצב מהיר יותר כמו פיתוח טכנולוגיה, במיוחד כשמדובר באינטרנט של הדברים, אבל אני צריך לחשוב שאנשים עושים כמיטב יכולתם ובתקווה שנגיע לשם. תמיד קצת קשה להישאר עשרה צעדים לפני גנבי סייבר ופושעי סייבר, אבל נגיע לשם.
ובכן חברים, עברנו שמונה דקות מעבר לשעה. אני רוצה להודות לאורחים שלנו בריאן בולקובסקי מאיירוספייק ודז בלנשפילד ורובין בלור. תודה רבה לך. אתה תמיד יכול למצוא את הארכיונים שלנו ב- insideanalysis.com, SlideShare, YouTube, יש לנו הרבה שידורי אינטרנט טובים שמציגים אנשים, זה היה חודש עמוס. זה יהיה חודש עמוס בחודש הבא, אז המשך להתעדכן ואנחנו מקווים לראות אותך בפעם הבאה. תודה אנשים, ביי ביי.