בית שמע מהי המערכת האקולוגית של Hadoop? - הגדרה מטכנולוגיה

מהי המערכת האקולוגית של Hadoop? - הגדרה מטכנולוגיה

תוכן עניינים:

Anonim

הגדרה - מה המשמעות של Hadoop Ecosystem?

המערכת האקולוגית Hadoop מתייחסת למרכיבים השונים בספריית התוכנה של Apache Hadoop, כמו גם לאביזרים וכלים שמספקת קרן Apache Software עבור פרויקטים מסוג זה של תוכנות, ולדרכים בהן הם עובדים יחד.

Hadoop היא מסגרת מבוססת Java הפופולרית ביותר לטיפול וניתוח קבוצות נתונים גדולות.

Techopedia מסביר את Hadoop Ecosystem

גם חבילת הליבה של Hadoop וגם האביזרים שלה הם לרוב פרויקטים עם קוד פתוח ברישיון של אפאצ'י. הרעיון של מערכת אקולוגית של Hadoop כרוך בשימוש בחלקים שונים במערך הליבה של Hadoop כמו MapReduce, מסגרת לטיפול בכמויות עצומות של נתונים, ומערכת הקבצים המופצת Hadoop (HDFS), מערכת טיפול קבצים מתוחכמת. יש גם YARN, מנהל משאבים של Hadoop.

בנוסף לאלמנטים מרכזיים אלה של Hadoop, אפאצ'י העבירה אביזרים או כלים משלימים למפתחים מסוגים אחרים. אלה כוללים Apache Hive, כלי לניתוח נתונים; Apache Spark, מנוע כללי לעיבוד נתונים גדולים; Apache Pig, שפת זרימת נתונים; HBase, כלי מסד נתונים; וגם אמברל, שיכולה להיחשב כמנהל מערכות אקולוגיות של Hadoop, מכיוון שהיא מסייעת לנהל את השימוש במשאבי Apache השונים הללו יחד. כאשר Hadoop הופך להיות הסטנדרט דה פקטו לאיסוף נתונים והופך בכל מקום בארגונים רבים, מנהלים ומובילי פיתוח לומדים הכל על מערכת האקולוגית של Hadoop ואילו סוגים של דברים מעורבים במערך כללי של Hadoop.

מהי המערכת האקולוגית של Hadoop? - הגדרה מטכנולוגיה