תוכן עניינים:
רק באמצעות ניתוח נתונים גדולים, מתברר הערך האמיתי של נתונים גדולים. עם זאת, ניתוחים אלה דורשים ידע סטטיסטי וטכני כדי ליישם כל פיתרון של נתונים גדולים. אז ההנחה הייתה שאתה צריך להיות מדען נתונים כדי להפיק תובנות משמעותיות מהנתונים הגדולים. כאן נכנס לתרגיל אפאצ'י. זה מספק את הגמישות לבצע ניתוחי נתונים גדולים ב- Hadoop מבלי שיהיה צורך בידע של מדען נתונים.
תרגיל אפאצ'י - מה זה?
מקדח אפאצ'י הוא מסגרת תוכנה שיכולה לנטרל נתונים גדולים ולהעביר את התובנות הנחוצות לך, ולהסתתר מתחת לפטיט של ערכות נתונים. מבחינה טכנית, Apache Drill הוא קוד פתוח, ANSI SQL סטנדרטי, אשר יכול לשמש כמנוע שאילתה עם זמן אחוי נמוך על המסגרת הפופולרית מבוססת Java Hadoop.
זה יכול לעבוד גם עם עדר של מסדי נתונים NoSQL מתפתחים כמו MongoDB, HBase וגם עם שרתי נתונים בענן, כמו Amazon S3 ו- Google Cloud Storage. נוסף על אלה, הוא גם מעלה את רמת ה- API של תקני תעשייה אחרים (ממשקי תכנות יישומים) כמו ODBC / JDBC ו- API של RESTful.