בית שמע כיצד אוכל ללמוד להשתמש ב- Hadoop לניתוח נתונים גדולים?

כיצד אוכל ללמוד להשתמש ב- Hadoop לניתוח נתונים גדולים?

Anonim

ש:

כיצד אוכל ללמוד להשתמש ב- Hadoop לניתוח נתונים גדולים?

ת:

מערך התוכנה של אפאצ'י המכונה Hadoop הופך למשאב פופולרי מאוד להתמודדות עם מערכי נתונים גדולים. מסגרת תוכנה לטיפול בנתונים מסוג זה נבנתה במטרה לסייע לצבור נתונים בדרכים ספציפיות, על סמך עיצובים שעשויים לייעל סוגים מסוימים של פרויקטים של נתונים. עם זאת, Hadoop הוא רק אחד מהכלים הרבים לטיפול במערכות נתונים גדולות.

אחת הדרכים הראשונות והבסיסיות ביותר ללמוד על ניתוח נתונים גדולים עם Hadoop היא להבין כמה מרכיבים ברמה העליונה של Hadoop ומה היא עושה. אלה כוללים "פלטפורמת ניהול משאבים" של Hadoop YARN שניתן להחיל על סוגים מסוימים של הגדרות רשת, וכן מערך פונקציות של Hadoop MapReduce החל על מערכי נתונים גדולים. יש גם מערכת קבצים מופצת של Hadoop (HDFS), שעוזרת לאחסן נתונים במערכות מבוזרות כך שניתן יהיה לאינדקס או לאחזר אותם במהירות וביעילות.

מעבר לכך, מי שרוצה להכיר יותר את Hadoop יכול לבדוק משאבים שפורסמו באופן פרטני עבור אנשי מקצוע המסבירים את התוכנה ברמה יחסית. דוגמה זו של כריס סטוצ'יו בבלוג אישי מספקת סט מצוין של נקודות על Hadoop וסולם נתונים. אחת התוספות הבסיסיות היא כי ניתן להשתמש בשימוש נפוץ יותר בחיידוק מהנדרש, וייתכן שהוא אינו הפיתרון הטוב ביותר לפרויקט אינדיבידואלי. סקירת משאבים מסוג זה תעזור לאנשי מקצוע להתמצא יותר בפרטי השימוש בהאדופ בכל תרחיש נתון. סטוצ'יו מספק גם מטפורות לקשר בין תפקידיו של Hadoop למשימות פיזיות ספציפיות. הנה, הדוגמה היא ספירת מספר הספרים בספריה, ואילו פונקציה של Hadoop עשויה לפרק את הספרייה לחלקים, לספק ספירות בודדות שמשתלבות בתוצאה נתונים מצטברת אחת.

דרך מעמיקה יותר שאנשי מקצוע יכולים ללמוד יותר על Hadoop ויישומה על נתונים גדולים היא באמצעות משאבי הכשרה ותוכניות ספציפיות. לדוגמא, לחברת הלמידה המקוונת Cloudera, ספקית בולטת של אימונים מרחוק, יש מספר אפשרויות מעניינות סביב השימוש בחדופ וסוגים דומים של טיפול בנתונים.

כיצד אוכל ללמוד להשתמש ב- Hadoop לניתוח נתונים גדולים?