תוכן עניינים:
- כדי לדבר עם בן אדם, אנא לחץ על 0
- אפליקציות טלפון אישיות: סירי, גוגל עכשיו
- איפה VR נופל שטוח
- מה העתיד צופן
האם התקשרת אי פעם לחברה כדי לקבל עזרה או לשלם את חשבונך, רק כדי לקבל את פניך קול מוקלט ונעים שרוצה לנהל איתך שיחה - אך אינך יכול להבין חצי ממה שאתה אומר? או אולי אתה הבעלים של אייפון, ובעוד שסירי נראתה לראשונה כבת ברית טובה, הבנת שלפעמים (אוקיי, בוא נהיה כנים, לעיתים קרובות) היא פשוט לא מבינה את זה? טכנולוגיית זיהוי קולי (VRT), הידועה גם בשם דיבור לטקסט, נופלת במלכודת נפוצה: יש לה פוטנציאל להיות מגניב להפליא (וילד, האם אנו שורשים את זה), אך לעיתים קרובות יותר מדובר בטחינת שיניים. תרגיל בתסכול.
פעם רעיון שהיה שייך לתחום המדע הבדיוני, זיהוי קול צמח עוד מימי ילדותו בשנות החמישים, כשמערכת אודרי של מעבדות בל תוכננה להכיר ספרות המדוברות בקול יחיד, לרשת המודרנית של אלקטרוניקה שיחה שאנו עוסקים בה עכשיו על בסיס יומי - עם תוצאות מעורבות.
כדי לדבר עם בן אדם, אנא לחץ על 0
רבים מהעסקים של ימינו משתמשים כיום במערכות הנקראות תגובת קול אינטראקטיבית (IVR) לטיפול בשיחות שירות לקוחות. השימוש הנפוץ ביותר הוא לתפריטים עם ניווט קולי, אך חברות מסוימות משתמשות במערכות IVR שיכולות לגשת למידע על חשבון הלקוח ולענות על שאלות קלות. תוכנת תפריט IVR כוללת בדרך כלל אוצר מילים מוגבל, שעשוי להיות מוגבל ל"כן ", " לא "ומספרים. מערכות מורכבות יותר יכולות לזהות מילים וביטויים ספציפיים לחברה.
מערכות אלה הופכות פופולריות יותר - לפחות לעסקים - מסיבה פשוטה: הן חסכוניות. על פי דו"ח של וול סטריט ג'ורנל מ -2010, שיחת לקוח טיפוסית שמגיעה לסוכן עולה בין 3 ל -9 דולר, ואילו שיחה המטופלת באמצעות מערכת אוטומטית עולה רק חמישה עד שבעה סנט. וכמובן, תוכנות מחשב לא מתעייפות, מתקשרות לחולים או מתוסכלות מהלקוחות (אם כי הלקוחות בהחלט מתוסכלים מהן!).
למרבה המזל, זה לא תמיד אומר שה IVR לוקח מקומות עבודה מאנשים - או לפחות שכל האנשים נעלמים ממרכזי הטלפון. העוזרים המופעלים באמצעות קול מאפשרים לחברי שירות לקוחות אנושיים להיות פרודוקטיביים יותר על ידי הפניית שיחות ומענה על שאלות פשוטות.
כמובן שמשתמשים אנושיים המקיימים אינטראקציה עם טכנולוגיות אלה, זה לא תמיד שיט חלק. הטכנולוגיה מסייעת בשיפור הבעיות הנפוצות בטכנולוגיית IVR, כמו בעיות עם מבטאים, אך פריצת מערכות אוטומטיות היא עדיין נושא מקוון ברשת. בדוק את המערכון הקומי הזה על מעלית מצוידת בזיהוי קולי, המדגישה את התסכול שיכולים לגרום לתקלות במערכות IVR.
אפליקציות טלפון אישיות: סירי, גוגל עכשיו
רוב האנשים מכירים זיהוי קולי לסמארטפונים. בעוד שרוב דגמי הטלפון האחרונים מגיעים עם VR, הפופולריות שלהם - והידוע לשמצה - התנפחה כאשר אפל הציגה את סירי, "עוזר אישי" העוקצני ועוקצני בקול עבור ה- iPhone 4S בשנת 2011. גוגל יצרה במהרה מתחרה ישיר: גוגל עכשיו למערכת ההפעלה אנדרואיד ג'לי שעועית. שתי המערכות כוללות קולות נשיים ותכונות זיהוי מתוחכמות המאפשרות למשתמשים "לדבר" לטלפונים שלהם בשפה סתמית.
אך בעוד שמערכות אלה מתוחכמות ופונקציונליות במידה ניכרת מקודמותיהן, הן גם מראות שלטכנולוגיה יש עוד דרך ארוכה. בדיחות על כישלונו של סירי הפכו למאמת אינטרנט פופולרית. אדם אחד אף תבע את אפל בגין פרסום כוזב ביחס ליכולותיה של סירי.
אולי זו הסיבה שבעוד שאפל יצרה את סירי כדי להיות מתקדמת ואינפורמטיבית, גם תוכנת VR היא קצת בצד המעורער. לדוגמה, אם אתה מדבר את אחד מקווי טכנולוגיית המודיעין הידועים לשמצה בתולדות הקולנוע מסרט משנת 1968 "2001: אודיסיאה בחלל" - "פתח את דלתות הפוד ביי" - סירי תגיב בשורה המענה מהסרט, " אני מצטער (שמך), אני חושש שאיני יכול לעשות את זה ", או יותר סרקסטי, " אנחנו סוכני הביון לעולם לא נחיה את זה, ככל הנראה. "
להתקשר אליך בשם זה רק אחד מהפונקציות שמנסות להקל על סירי לאהוב, וקצת יותר אנושיות. עוזר ה- VR יכול לעקוב אחר פקודות קוליות לביצוע שיחות, לקביעת תכתיב ולשליחת טקסטים, לבצע חיפושים באינטרנט למידע, למצוא חנויות סמוכות, לתת הוראות נסיעה ועוד, והכל ללא צורך לגעת בשום דבר. תשובות מדוברות בו זמנית בטלפון ומוצגות על המסך.
גוגל עכשיו, חלק ה- VR של פלטפורמת Jelly Bean אנדרואיד, דומה מאוד לסירי. המערכת מציעה את אותן יכולות זיהוי נרחבות על ידי תרגום דיבור סתמי לפקודות המאפשרות למשתמשים לבצע שיחות, לשלוח טקסטים, להריץ חיפושים, לבצע חישובים והמרות, לתפוס הגדרות מילים, להגדיר אזעקות, להשמיע שירים ולקבל מפות והוראות.
אצל עוזרי קול אישיים כמו סירי וגוגל עכשיו, היתרונות ברורים. כל דבר, החל משיחות וטקסטים לחיפוש ובידור מהיר וקל יותר. רק תגיד מה שאתה רוצה, ו (ברוב הפעמים) אפליקציית VR תופסת את זה בשבילך. הטכנולוגיה הידנית כבויה של VR מועילה במיוחד בזמן נהיגה. ואף על פי שאנשים רבים פסקו את הפגמים של סירי, והכותבים טענו כי היכולת של גוגל עכשיו לנהל את חייהם של המשתמשים בעצם מפחידה מעט מעליבה, רוב האנשים עדיין מרגישים שהטכנולוגיות העתידניות האלה די מגניבות.
כמובן שאפליקציות טלפון אישיות כמו סירי וגוגל עכשיו רחוקות מלהיות מושלמות - אם כי הן אכן מראות לאן ניתן יהיה לפנות טכנולוגיה זו בעתיד. המשמעות היא שגם כשסירי מעלה תשובה שגויה, סביר להניח שאנחנו צוחקים וסולחים לה, בידיעה שהגרסה הבאה תהיה טובה בהרבה.
איפה VR נופל שטוח
אם אי פעם נתקלת ב- IVR כאשר התקשרת לעסק, יתכן ששמת לב לחסמים מסוימים לתקשורת. יש תוכנות שמשתמשות בקול רובוטי של טקסט לדיבור המבטא בצורה שגויה מילים ומקשות על הבנתן. לאחרים יש בעיות רגישות שגורמות לכך שהתוכנה לא יכולה לעבד את מה שאתה אומר אם אתה חזק מדי, רך מדי או לא משלים בזהירות.
בנוסף, אנשים רבים עדיין לא מרגישים בנוח לדבר עם מכונה. אם תבצע מספר חיפושים ב- IVR, תתקל ברשימות שאנשים הציבו דרכים לעקוף מערכות IVR ולהגיע ל"אדם אמיתי ". פתרונות אלה נעים בין "המשך ללחוץ על 0 למפעיל" ועד "להישבע במכונה עד שהיא תביא בן אנוש." כתוצאה מכך, חלק גדול מההתפתחות האחרונה במערכות IVR נסבה סביב הפיכתן ליותר טעימות לבני אדם; מה שהופך את הקולות לאוהדים יותר ופחות רובוטיים, מקלים על מערכת הניווט ומאפשרים למתקשרים לדעת כמה זמן ייקח כל העניין מההתחלה ועד הסוף. מה שמרמז שהטכנולוגיה הטובה יותר היא רק מחצית הקרב כאן; המחצית השנייה מביאה משתמשים לסיפון לדבר עם מכשיר.
מה העתיד צופן
למרות האתגרים הללו, טכנולוגיית זיהוי הקול משתפרת כל הזמן. יישומים כמו סירי וגוגל עכשיו - פגמים וכולם - עדיין מרשימים בצורה יוצאת דופן בביצועיהם, וכמה חברות מרחיבות יכולות VR לאפליקציות אחרות.
לדוגמא, Nuance, יוצרי תוכנת הדיבור לטקסט של Dragon NaturallySpeaking בטקסט לטקסט, כבר פיתחו בקרות קוליות לטלוויזיות ומכוניות, וגרסאות של טכנולוגיה זו משולבות בכמה טלוויזיות סמסונג ומערכות הבידור של SYNC המשמשות ברכבי פורד מסוימים.
וככל שגוגל ואפל ממשיכים למצוא שימושים חדשים בטכנולוגיות זיהוי הקולי שלהם, סביר להניח שנדבר יותר ויותר עם כל מיני מכונות יומיומיות, מהטלוויזיות שלנו ועד הטוסטרים שלנו. ושוב, נראה כאילו מדע בדיוני צדק. נצטרך רק לקוות שכותבים חכמים אלה טעו בדבר אחד. אם המכונות האלו משתלטות עליכם, אתם עלולים להסתבך בפעם הבאה שתבקשו מסירי "לפתוח את דלתות המפרץ".
