בית מגמות מה עדיף, פלטפורמה או אלגוריתם למידה מכונה משלך ב- aws?

מה עדיף, פלטפורמה או אלגוריתם למידה מכונה משלך ב- aws?

Anonim

ש:

מה עדיף, פלטפורמה או אלגוריתם למידה מכונה משלך ב- AWS?

ת:

בימינו חברות רבות משלבות פתרונות למידת מכונות בערכת כלי הניתוח שלהם כדי לשפר את ניהול המותג, לשפר את חוויית הלקוחות ולהגדיל את היעילות התפעולית. מודלים של למידת מכונה הם המרכיב העיקרי בפתרונות למידת מכונה. מודלים מאומנים באמצעות אלגוריתמים מתמטיים ומערכות נתונים גדולות כדי לבצע תחזיות אמינות. שתי דוגמאות נפוצות לתחזיות הן (1) קביעה אם קבוצה של עסקאות פיננסיות מעידה על הונאה או (2) הערכת רגשות הצרכנים סביב מוצר, על סמך תשומות שנאספו ממדיה חברתית.

אמזון SageMaker הוא שירות מנוהל באופן מלא המאפשר למפתחים ומדעני נתונים לבנות, לאמן ולפרוס מודלים של למידת מכונות. ב- SageMaker, אתה יכול להשתמש באלגוריתמים מחוץ לתיבה או ללכת בדרך להביא את עצמך לפיתרון מותאם אישית יותר. שתי הבחירות תקפות ומשמשות באותה מידה כבסיס לפיתרון מצליח של למידת מכונה.

(הערת העורך: תוכל לראות חלופות אחרות ל- SageMaker כאן.)

האלגוריתמים של SageMaker מחוץ לתיבה כוללים דוגמאות פופולריות ומותאמות במיוחד לסיווג תמונות, עיבוד שפות טבעיות וכו '. את הרשימה המלאה תוכלו למצוא כאן .

  • יתרונות מחוץ לתיבה: אלגוריתמים אלו עברו אופטימיזציה מראש (ועוברים שיפור מתמיד). אתה יכול להיות למעלה, לרוץ ולפרוס במהירות. בנוסף, כוונון היפר-פרמטרים אוטומטי של AWS זמין.
  • שיקולים מחוץ לתיבה: השיפורים המתמשכים שהוזכרו לעיל עשויים שלא להניב תוצאות בצורה צפויה כאילו הייתה לך שליטה מלאה ביישום האלגוריתמים שלך.

אם האלגוריתמים האלה אינם מתאימים לפרויקט שלך, יש לך שלוש אפשרויות אחרות: (1) ספריית Apache Spark של אמזון, (2) קוד Python מותאם אישית (המשתמש ב- TensorFLow או Apache MXNet) או (3) "להביא משלך" לאן שאתה הם למעשה בלתי מוגבלים, אך יהיה עליהם ליצור תמונת Docker כדי להכשיר ולהגיש את המודל שלך (ייתכן שתעשה זאת באמצעות ההוראות המופיעות כאן ).

הגישה להביא-בעצמך מציעה לך חופש מוחלט. זה עשוי להיות אטרקטיבי עבור מדעני נתונים שכבר הקימו ספרייה של קוד אלגוריתמי מותאם אישית ו / או קנייני שאולי לא מיוצג במערך הנוכחי מחוץ לתיבה.

  • יתרונות של Bring-Your-Own: מאפשר שליטה מלאה על כל צינור מדעי הנתונים יחד עם שימוש ב- IP קנייני.
  • הביאו שיקולים משלך: יש צורך במעגן עיבוי כדי להכשיר ולשרת את המודל המתקבל. שילוב שיפורים אלגוריתמיים הוא באחריותך.

ללא קשר לבחירת האלגוריתם שלך, SageMaker ב- AWS היא גישה שכדאי לקחת בחשבון בהתחשב בכמה מיקוד הושם על קלות השימוש מנקודת מבט מדעי נתונים. אם ניסית אי פעם להעביר פרויקט למידת מכונות מהסביבה המקומית לסביבת אירוח, תופתע לטובה עד כמה SageMaker הופך אותו ללא תפר. ואם אתה מתחיל מהתחלה, אתה כבר כמה צעדים קרוב יותר למטרה שלך, בהתחשב בכמה כבר בהישג ידך.

מה עדיף, פלטפורמה או אלגוריתם למידה מכונה משלך ב- aws?