ש:
מה ההבדל בין למידת מכונה לכריית נתונים?
ת:כריית נתונים ולמידת מכונות הם שני מונחים שונים מאוד - אך לרוב משתמשים בשניהם באותו הקשר, שזו היכולת של הצדדים לשכלל ולמיין נתונים כדי להגיע לתובנות ומסקנות. הדמיון וההבדלים ביחד יכולים לגרום לדבר על שני תהליכים שונים זה מזה לבלבל בקרב קהלים מפותחים פחות.
כריית נתונים היא תהליך צבירת נתונים ואז חילוץ נתונים שימושיים מאותה מערך נתונים גדול יותר. זה סוג של גילוי ידע שמתרחש מאז שהצלחנו לצבור כמויות גדולות של נתונים. אתה יכול לבצע כריית נתונים באמצעות מערכת פרימיטיבית למדי: התוכנית תוכנת לחפש דפוסים ומגמות נתונים ספציפיות, ומידע טכני "יכרות" מאותה מסת נתונים גולמית בכל צורה שהיא תהיה.
למידת מכונה היא משהו חדש ומתוחכם יותר. למידת מכונה אכן משתמשת במערכות נתונים, אך בניגוד לכריית נתונים, למידת מכונה משתמשת באלגוריתמים והתקנות משוכללים כמו רשתות עצביות כדי לאפשר למכונה ללמוד למעשה מנתוני הקלט. ככאלה, למידת מכונה היא לא מעט יותר מעמיקה מאשר פעולת כריית נתונים. לדוגמה, ברשת עצבית, נוירונים מלאכותיים עובדים בשכבות בכדי לקבל נתוני קלט ומשחררים נתוני פלט עם הרבה פעילות "קופסה שחורה" מורחבת בין לבין (המונח "קופסה שחורה" חל על מערכות מתוחכמות יותר כאשר לבני אדם יש קשה להבין כיצד הרשתות או האלגוריתמים העצביים למעשה מבצעים את עבודתם).
כריית נתונים ולמידת מכונות שונות גם הן ביישומים שלהן לארגון. שוב, כריית נתונים יכולה להימשך בכל יישום ERP נתון, ובתהליכים רבים ומגוונים.
לעומת זאת, פרויקט למידת מכונה דורש משאבים רבים. מנהלי פרויקטים צריכים להרכיב את נתוני האימונים והבדיקות, לחפש בעיות כמו התאמה יתר, להחליט על בחירת תכונות וחילוץ תכונות, ועוד ועוד. למידת מכונה יכולה לדרוש צורות רכישה מורכבות מצד בעלי עניין שונים, ואילו פעילויות כריית נתונים בדרך כלל רק דורשות כניסה מהירה.
למרות ההבדלים הללו, הן כריית נתונים והן למידת מכונות חלים על תחום מדעי הנתונים. למידה נוספת על מדעי נתונים עוזרת לבעלי העניין ללמוד יותר על אופן פעולתם של תהליכים אלה וכיצד ניתן ליישם אותם בכל ענף נתון.