בית שמע מדוע הניצוץ הוא פלטפורמת הנתונים הגדולים העתידית

מדוע הניצוץ הוא פלטפורמת הנתונים הגדולים העתידית

תוכן עניינים:

Anonim

אפאצ'י חאופ היה הבסיס ליישומי Big Data כבר זמן רב ונחשב לפלטפורמת הנתונים הבסיסית עבור כל ההצעות הקשורות לביצוע נתונים גדולים. עם זאת, מסד הנתונים והחישוב בזיכרון צוברים פופולריות בגלל ביצועים מהירים יותר ותוצאות מהירות. Apache Spark היא מסגרת חדשה המשתמשת ביכולות הזיכרון בכדי לספק עיבוד מהיר (כמעט פי מאה מהיר יותר מאשר Hadoop). לכן, השימוש במוצר Spark הולך וגובר בעולם של נתונים גדולים ובעיקר לעיבוד מהיר יותר.

סמינר וובינר: כוחה של ההצעה: כיצד קטלוג נתונים מעצים אנליסטים

הירשם כאן

מה זה ניצוץ אפאצ'י?

Apache Spark הוא מסגרת קוד פתוח לעיבוד נפחי נתונים עצומים (Big Data) במהירות ובפשטות. זה מתאים ליישומי ניתוח המבוססים על נתונים גדולים. ניצוץ יכול לשמש בסביבת Hadoop, עצמאית או בענן. זה פותח באוניברסיטת קליפורניה ואז הוצע לאחר מכן לקרן תוכנת אפאצ'י. לפיכך, היא שייכת לקהילת הקוד הפתוח ויכולה להיות מאוד חסכונית, מה שמאפשר עוד יותר למפתחי חובבים לעבוד בקלות. (למידע נוסף על הקוד הפתוח של Hadoop ראו מהי השפעת הקוד הפתוח במערכת האקולוגית של Apache Hadoop?)

המטרה העיקרית של Spark היא שהיא מציעה למפתחים מסגרת יישומים העובדת סביב מבנה נתונים ממורכז. הניצוץ הוא גם חזק ביותר ובעל יכולת מולדת לעבד במהירות כמויות אדירות של נתונים בפרק זמן קצר, וכך הוא מציע ביצועים טובים במיוחד. זה עושה את זה הרבה יותר מהר ממה שנאמר כמתחרה הקרוב ביותר שלו, Hadoop.

מדוע הניצוץ הוא פלטפורמת הנתונים הגדולים העתידית