שילוב מקורות נתונים בהאדופ הוא עסק מורכב. חלק מהסיבות לכך כוללות:
- סקריפטים מותאמים אישית וספציפיים למקור המשלבים מקורות נתונים הם בעייתיים.
- שימוש בשילוב נתונים או בכלי מדעי נתונים מביא יותר מדי אי וודאות.
- הוספת נתונים ממקורות חיצוניים היא דבר בלתי אפשרי.
היום אני הולך לדון כיצד משפרת את האנליטיקה של Hadoop באמצעות טכנולוגיות מקור-אגנוסטיות שמקלות על שילוב מקורות נתונים פנימיים וחיצוניים. בנוסף לתיאור כיצד שיטות המקור-אגנוסטיות עובדות, אסקור גם מדוע ניתוח Hadoop זקוק ליכולות מובנות של אינטליגנציה והעברת ידע, הבנה של מערכות יחסים ומאפייני נתונים, וארכיטקטורה ניתנת להרחבה וביצועים גבוהים.
וובינר: מטריצות של משמעות: חיבור הנקודות בתוך Hadoop - הירשם כאן |