ש:
כיצד יכולות למידה חדשה של מכונות לאפשר כריית מסמכי מלאי לנתונים פיננסיים?
ת:אחת הגבולות החדשים והמרתקים של למידת מכונות ו- AI היא שמדענים ומהנדסים יוצאים בדרכים שונות להשתמש בסוגים חדשים של משאבים כדי לחזות תנועת מניות ותוצאות השקעה. זהו מחליף משחק אדיר בעולם הפיננסי, ויחולל מהפכה באסטרטגיות השקעה בצורה מאוד עמוקה.
אחד הרעיונות הבסיסיים להרחבת מחקר מסוג זה הוא בלשנות חישובית, המערבת דוגמנות של שפה טבעית. מומחים בודקים כיצד להשתמש במסמכי טקסט, החל מהגשת SEC למכתבי מניות ועד משאבים מבוססי טקסט היקפיים אחרים, על מנת להגדיל או לכוונן את ניתוח המניות או לפתח ניתוחים חדשים לחלוטין.
הורדה חינם: למידת מכונה ולמה זה חשוב |
הוויתור החשוב הוא שכל זה אפשרי רק באמצעות התקדמות חדשה לגמרי ברשתות עצביות, למידת מכונות וניתוח שפה טבעית. לפני הופעת ה- ML / AI, טכנולוגיות המחשוב השתמשו בעיקר בתכנות לינארית כדי "לקרוא" תשומות. מסמכי טקסט לא היו מובנים מדי מכדי שיהיו מועילים. אך עם ההתקדמות בניתוח השפה הטבעית במהלך השנים האחרונות, מדענים מגלים שאפשר "לכרות" את השפה הטבעית לתוצאות ניתנות לכימות, או במילים אחרות, תוצאות שאפשר לחשב בדרך כלשהי.
כמה מהעדויות הטובות והדוגמאות השימושיות ביותר לכך נובעות מסרטציות שונות ועבודות דוקטורט הזמינות ברשת. במאמר, "יישומים של למידת מכונות ובלשנות חישובית בכלכלה פיננסית", שפורסם באפריל 2016, לילי גאו מסבירה בצורה ניכרת תהליכים רלוונטיים המיועדים לכריית הגשת SEC בתאגידים, שיחות מניות והודעות מדיה חברתית.
"חילוץ אותות משמעותיים מנתוני טקסט לא מובנים וממדים גבוהים אינה משימה קלה", כותב גאו. "עם זאת, עם התפתחות של למידת מכונות וטכניקות לשוניות חישוביות, ניתן לבצע משימות וניתוח סטטיסטי של מסמכים טקסטואליים. יישומים רבים של ניתוח טקסטים סטטיסטיים במדעי החברה הוכיחו כמוצלחים." מהדיון של גאו על דוגמנות וכיול בתקציר, המסמך המפותח כולו מראה כיצד חלק מסוג זה של ניתוח עובד בפירוט.
מקורות אחרים לפרויקטים פעילים כוללים דפים כמו תקציר פרויקט GitHub זה, ומשאב IEEE המדבר ספציפית על קבלת מידע פיננסי חשוב מ"ניתוח סנטימנטים בטוויטר ".
בשורה התחתונה, השימוש בדגמי NLP החדשים הללו מניע חדשנות מהירה בשימוש בכל מיני מסמכי טקסט, לא רק לניתוח פיננסי, אלא לסוגים אחרים של גילוי חדשני, המטשטשים את הקו המסורתי שבין "שפה" ל "נתונים."