VocaSDK – זיהוי קולי בסמארטפון – חידוש מפתיע ומועיל לעסקים

זיהוי קולי בסמארטפון

✅ איך משיגים חיסכון בהוצאות העסק ע"י מעבר לזיהוי קולי בסמארטפון?

✅ האם ניתן לשפר את התקשורת של העסק עם לקוחותיו במעבר לשירותי תקשורת מבוססי זיהוי קולי נייד המנוהל בענן (או מקומית)?

✅ היתרונות באימוץ טכנולוגיות זיהוי קולי לשיפור ולייעול חוויית הלקוחות, העובדים והמשתמשים, עם תמיכה בכל סוגי הסמארטפונים.

שירותי הטלפוניה והתקשורת בעסקים קטנים, בינוניים ואף גדולים היו, למעשה, "בור תקציבי" בלי כל תחתית. בשנה האחרונה התחרות בשוק העסקי יצאה לדרך, וניתן להשיג חיסכון בהוצאות התקשורת הטלפונית בתכנון נכון וזהיר.

אחת ההוצאות הכבדות ביותר בעסקים ובארגונים אלה הם אנשי תמיכה ומוקד, שעולים בישראל כ-165 אלף ₪ לשנה על כל מוקדן (כולל עלויות ההכשרה של המוקדן אך ללא עלויות הציוד והתשתיות הנדרשות לכל מוקדן). המהפכה הזו התחילה ביצירת מערכות צ'טבוטים והמשיכה למערכות של זיהוי קולי, ניתוב שיחות קולי ורובוטים קוליים והשלב האחרון במהפכה, שכבר החל, הוא רובוטים אנושיים, שמחלפים לגמרי את הצורך באנשים, בתפקידים רבים הכרוכים במגע עם הלקוחות, שותפים, ספקים וגם בתוך העסק עצמו.

אחת השחקניות הבולטות בתחום היא חברת אודיוקודס (מקרית שדה התעופה לידי נתב"ג), שהכריזה לאחרונה על מהלך מהיר של הוספת AI (ר"ת: Artificial Intelligence) -אינטליגנציה מלאכותית, למערכות זיהוי דיבור של החברה, ליצירת קו חדש של פתרונות לשוק והוקמה בחברה חטיבה חדשה בשם Voice.AI, לצורך ההתפתחות המבטיחה הזו. זה חלק מהתפתחות תחום שירותי התקשורת בענן.

יישומים קוליים מבוססי AI יכולים לשפר תהליכים פנימיים בתוך הארגון ומול לקוחות העסק, וזה מספק ROI (החזר השקעה) מהיר ביותר, בכל עסק המאמץ את כיוון ההתפתחות הזה.

לקבלת הצעת מחיר עבור פתרונות זיהוי קולי בסמארטפון

מה זה VocaSDK?

המדובר ב"מנוע" לאפליקציות מובייל, שמתאים לכל אפליקציית מובייל הנמצאת על כל סמארטפון, עם תמיכה מלאה ב-2 מערכות ההפעלה הנפוצות בשוק: iOS של אפל ו-Android של גוגל (על גרסותיה השונות).

כך, כל עסק יכול להרחיב את היכולות של כל אפליקציה המשמשת אותו ואת לקוחותיו (או פנימה – את עובדיו, שותפיו וספקיו). כך, שאותה אפליקציה תפעל בפקודות קוליות של המשתמש המחזיק בסמארטפון.

דוגמה מוחשית היא השדרוג של מערכת השליטה במזגנים החדשים של חברת אלקטרה, במערכת הנקראת "אלקטרה Smart". כך, ניתן לשלוט במזגן מכל מקום (דרך רשת הסלולר) ולא רק כשנמצאים בבית או במשרד.

במקום שהמשתמשים יקישו על כפתורים באפליקציה או במכשיר שלט-רחוק כדי לשלוט במזגן, הם פשוט מדברים עם המזגן ונותנים לו פקודות בקולם (ומקבלים משוב בקול) דרך הסמארטפון.

המערכת הזו היא שילוב של עולם ה-IoT (האינטרנט של החפצים) ומערכות זיהוי קולי, שפותחה ע"י אודיוקודס תחת מערכת VocaSDK. היתרון במערכת הספציפית של אלקטרה הוא, שאין צורך בחיבור של הסמארטפון לאינטרנט כדי שהפקודות הקוליות של המשתמש תעבורנה למזגן, שכן הפקודות הללו יכולות לעבור גם ברשת הקול והמסרונים של ספק הסלולר. ברור, שהחוויה המלאה של השימוש במערכת מושגת בחיבור של הסמארטפון לאינטרנט. יודגש, שהמזגן אמור להיות מחובר כל הזמן לאינטרנט דרך רשת ה-WiFi הביתית או המשרדית.

בבסיסה של המערכת קיים פיקוד מסוגNLP – Natural Language Processing, שמאפשר למשתמש לדבר למכשיר בצורה טבעית לגמרי. המערכת מנתחת את המשפט בצורה קונטקסטואלית, מזהה את הפקודות ומתרגמת אותן לכדי ביצוע. כך למשל, המשתמש יכול לומר: "קר לי מאוד אני מבקש שתעלה את הטמפרטורה ל- 25 מעלות" ובעזרת תשתית ה-IoT של IBM ואלקטרה, המזגן ידע לתרגם את שנאמר לכיוון המזגן למצב קירור, עוצמת עבודה מרבית בטמפרטורה של 25 מעלות. במידה והמערכת לא מצליחה לזהות את המשפט, שאומר המשתמש, עובר קובץ אודיו אוטומטית למערכות של חברת AudioCodes לצורך תהליך של אופטימיזציה. בתום התהליך מעודכן הלקסיקון בענן. כך, שכל משתמש מחובר יוכל ליהנות מהרחבת הפקודות. המערכת תומכת במגוון שפות כולל עברית.

היתרונות של VocaSDK

מנוע זיהוי דיבור המתאים לכל אפליקציה סלולרית, על כל מכשיר סלולרי חכם הקיים בשוק.
הדיבור של המשתמש הוא חופשי לחלוטין והתמיכה תהיה כמעט בכל שפה, כולל בעברית. תומך מלא כרגע באנגלית, גרמנית ועברית.
יכולת תפעול גם כשאין אינטרנט (דרך הרשת הרגילה של ספק הסלולר).
המערכת משתפרת עם הזמן ע"י שיהוי המאפיינים הייחודיים של קולו של המשתמש וזיהוי ניואנסים הקיימים בקולו של כל משתמש (התאמה אישית של הזיהוי הקולי לכל משתמש).
שילוב מהיר באפליקציות עסקיות קיימות תוך התאמה לצרכים של כל עסק.

אודיוקודס מספקת לשוק מגוון רחב של פתרונות בתחום זיהוי הדיבור, לא רק במובייל. ההצלחה של אודיוקודס החלה דווקא בתחום ניתוב שיחות עסקי, מהלך שבא להחליף גם את המרכזניות וגם את מערכות ה-IVR המעצבנות את המתקשרים.

בעבר, אודיוקודס התמחתה במתן פתרונות בעולם ה-VoIP לארגונים ולעסקים, כאשר בשנת 2000 ביצעה השקעה ראשונה בחברת ההזנק NSC, שנרכשה בהמשך הדרך ומוזגה לתוך אודיוקודס, עם קו המוצרים, שכעת התפתח לכיוון ה-AI.

ב-2017 אודיוקודס הפכה לחברה מובילה עולמית, גם בגלל יכולות הפיתוח העצמיות שלה וגם בגלל השת"פ ההדוק והאסטרטגי שלה עם מיקרוסופט, כשהתחברה אל מיקרוסופט כבר מהמוצר הראשון שלה לעולם התקשורת הארגונית: Lync. כיום, המוצר המוביל של מיקרוסופט הוא סקייפ לעסקים, שמוחלף כעת ע"י מערכת Teams. פותחו מוצרים רבים התואמים לקו המוצרים של מיקרוסופט, בעיקר טלפונים, נתבים, חומות אש, מבואות, שירותי ענן, שירותי ניתוב שיחה ועוד.

המוצרים הראשונים, שנולדו מהשילוב של פתרונות NSC והשת"פ עם מיקרוסופט, היו בסדרה, ששמה VocaNOM, שמשמשת כיום במאות רבות של עסקים בכל רחבי העולם, לניתוב שיחות קולי. בהתחלה זה בוצע בהתקנות מקומיות של המערכת, אך כיום הכל מוצע בענן, כשעיקר הלקוחות משתמשים בענן של אמזון ולא רק בזה של מיקרוסופט, לפי רצון לקוחות הקצה. בהמשך נולד עם קו מוצרי AC Voca, שמתפתחים לכל הכיוונים ויש לתחום הזה פורטל מיוחד.

מהן המערכות הקיימות והחדשות של אודיוקודס?

SmartTAP – מערכת מלאה לתקשורת אחודה. היא כוללת הכול, כולל ניהול חדרי ישיבות ותואמת לכל קווי הפתרונות של מיקרוסופט.

SmartTAP 360 – מערכת הקלטות מתקדמת, שמאפשרת להקליט את כל סוגי השיחות, החל משיחות וידאו וכלה בצ'טים ומסרים מידיים. זה פתרון מלא, שמקדים בהרבה את מה שקיים בשוק (פתרונות, שבהם ניתן להקליט רק שיחות קול, או לכל היותר קול ווידיאו).

סייען אישי – Personal Assistance. כאן פוצח האתגר להגיע ל-95% דיוק בזיהוי דיבור. באודיוקודס השיגו את היעד הזה, אבל השוק העולמי עוד טרם זיהה את היתרונות של הפתרון הזה. בפועל, רק 3% מהארגונים בעולם משתמשים באיזו מערכות זיהוי דיבור. כך, שיש כאן פוטנציאל שוק ענק. באודיוקודס משלבים בזה כלי ביג-דאטה ו-AI. המוצר הראשון בתחום זה היה AC Voca, שסיפק כמה שירותי זיהוי דיבור לארגונים ומזה צמחו כמה וכמה שירותים: VocaNOM בגרסה מתקדמת, VocaOne לעסקים בעלי סניפים מבוזרים בארץ ובעולם, Voca Bot שזה שירות חדש, שתופס תאוצה בשוק (יפורט מיד) ו-VocaSDK שפורט לעיל.

VocaASR – מנוע עצמאי למערכות IVR ולכל סוגי מוקדי השירות. כך, שניתן לשדרג את המערכות הקיימות הללו, שתתמוכנה בטכנולוגיות זיהוי קולי, בלי לשנות את המערכת הבסיסית, שכבר קיימת בעסק. המערכת מספקת את היכולות של פתרון AC Voca של אודיוקודס לכל מערכת מותקנת בעסק, הגם שאינה של אודיוקודס. המערכת כוללת בתוכה כבר יכולות AI מובנות.

VocaBOT – זה פתרון חדש המתווסף לקו המוצרים הוותיק, שירות של צ'טבוט קולי. מדובר בפתרון המספק אוטומציה למתן מידע קולי או כשירות לקוחות. דוגמה להמחשה: השירות הופעל בחברת דנאל לדיווח שעות עבודה של עובדי סיעוד בשטח באופן אוטומטי בקול, ללא צורך בהקשות או כתיבה, כולל זיהוי מיקום. כך, נחסכה כל הניירת הקשורה בדיווח על הפעלת עובדי סיעוד בשטח (למשל בבתי המטופלים) ונחסך הצורך בעובדי מוקד כדי שיקבלו וירשמו את הדיווחים הללו (של תחילה וסיום עבודה). הכל אוטומטי ונעשה בקולו של עובד הסיעוד, שמתקשר מהסמארטפון שלו לצ'טבוט הקולי.

הפתרון הזה אומץ בתחומים רבים, למשל מרכז סוזן-דלל בת"א החל למכור כרטיסים למופעים, שמתבצעים במרכז המחול והתיאטרון הזה, באמצעות הצ'טבוט החדש וכך חסך כמעט את כל עובדי המכירות, שישבו במוקד המכירות של המרכז. כעת, ניתן לרכוש כרטיסים 24 שעות ביממה, ללא המתנה בתור למענה אנושי ובחוויית שימוש טובה.

היתרון הגדול של אודיוקודס מול פתרונות ענן אחרים כמו גוגל, הוא בזה, שהשירות הזה ניתן ON PREMISE (מקומית) בחצר הלקוח, ללקוח הרגיש לבעיות אבטחת מידע, או בענן, לפי רצון הלקוח.

אודיוקודס מספקת בפתרון החדש הזה תמיכה מלאה ואינטגרציה למערכת CRM של הארגון וגם מערכת דו"חות ניהול גמישים לפי צרכי הלקוח.

הפתרון החדיש הזה מבוסס על טכנולוגיה בשם: Guided Natural Language Understanding – Guided-NLU, ובו המערכת עוזרת למשתמש לבטא בקולו את בקשותיו או את הדיווחים שלו, ע"י שאלות המנחות את הדובר. כך, המערכת הזו עובדת 24 שעות ביממה, שלא כמו מוקדן אנושי, היא לא מתעייפת ולא זקוקה למנוחה. חוויית השימוש טובה ונשמרת כל הזמן ואף משתפרת עם הזמן, כי המערכת לומדת כל הזמן את כל הניואנסים הספציפיים של הדיבור של מי שמתקשר אליה.

ניתוב שיחות חכם לעסקים וארגונים באמצעות זיהוי בקשתו של המחייג. זו מערכת המחליפה את ה-IVR הוותיק (ר"ת: Interactive Voice Response), זה, כאמור, תחום הצומח במהירות. מובילת השוק בישראל בתחום הניתוב (ניתוב שיחות עסקי) הן בזק (בשירותים הוותיקים מבוססי IVR) וכאמור, אודיוקודס, עם נתב שיחות מתקדם מבוסס זיהוי קולי המופעל בענן (או מקומית).

בעידן, שבו כולם (מנהלים, עובדים, לקוחות, ספקים, שותפים וכיו"ב) עברו לסמארטפונים, טכנולוגיית נתב השיחות אמורה לעבור שדרוג והיא יכולה להיות אחד הכלים החזקים ביותר בהנגשת שירותים עצמיים וכלי דיגיטל לכולם. נתב שיחות מתקדם, שמתוכנן היטב, מאפשר ללקוחות לפתור במהירות ובקלות נושאים שגרתיים. שינויים קלים בנתב השיחות יכולים להפוך את הנתב לשימושי יותר עבור הלקוחות, להעלות את שביעות הרצון שלהם ולצמצם פניות למוקד השירות והתמיכה.

אין זה סוד, שלקוחות קיימים או פוטנציאליים מחפשים שירות פשוט ומהיר ואינם אוהבים את השימוש בנתב השיחות הישן, במיוחד זה המבוסס על עקרונות ה-IVR הישנים, של הקשת מספרים כדי להתקדם למוקדן המבוקש.

נכון, שהתקדמנו משמעותית מבחינת הטכנולוגיה המסייעת לחוויית שירות מוצלחת יותר במוקדי שירות, אבל נראה, שבכל מה שקשור לשירות הטלפוני, אנו עדיין חיים, פחות או יותר, בתקופת האבן (או מדויק יותר, בתקופה בה הטלפון הומצא: במחצית השנייה של המאה ה-19. אז גם החלו לפעול המרכזניות הראשונות. זה עובד בדיוק אותו דבר גם כיום, בחלק נכבד ממוקדי שירות הלקוחות בישראל, במיוחד אלה הנמצאים בעסקים ברמת ה-SMB וה-SME).

לכן, כבר בחיוג עצמו ניתן לספק למחייג חוויית שירות אחרת וראוי לסיים את הגישה המיושנת ולייצר מגע עם הפונה בצורה מתקדמת ומתאימה למאה ה-21. שיטת ה-IVR, שהומצאה בתחילת שנות ה-80, עדיין פועלת ברוב מוקדי השירות בישראל, ומרגיזה את הדור הצעיר (וגם את כל שאר הפונים בכל הגילאים), שנאלצים לעבור בין תפריטים ע"י הקשת מספרים חוזרת ונשנית.

הפיכת ה-IVR ל-Visual IVR היא לא בדיוק הפתרון המלא והנכון, שהציבור מחפש. להחליף לחיצה על מקשי הטלפון בלחיצה על תפריט באפליקציה, זו לא בדיוק התקדמות טכנולוגית מדהימה, שתפתור את בעיית היעדר "חוויית לקוח". כל הרגולציות המחמירות, שחוקקו בישראל בתחום מוקדי השירות, עדיין לא פתרו את בעיית היעדר "חוויית משתמש", שהיא הבעיה המרכזית של רוב מוקדי השירות בישראל.

כיום, עסק קטן יכול ליהנות מפתרונות תקשורת מתקדמים דוגמת תקשורת וטלפוניה בענן, שבעבר היו נחלתם של עסקים גדולים בלבד, שהשקיעו מעל 10,000 $ לעמדת עבודה, בנוסף להשקעות ב-IVR, הכשרת מוקדנים, מערכות שליטה וניהול, עלויות תחזוקה ורישיונות ועוד.

המובילה בישראל בתחום ניתוב שיחות על בסיס שיחה טבעית והבנת הדובר (לאן הוא מעוניין להגיע בפנייה שלו) וללא כל הקשת ספרות (IVR) לצורך ניתוב השיחה היא (כאמור לעיל) חברת אודיוקודס הישראלית, במערכות זיהוי דיבור וניתוב בענן בשם: VocaNOM ו-VocaONE.

מדובר ב-2 המערכות הללו (VocaNOM ו-VocaONE) בחיסכון של עד 75% בזמן ההמתנה למתקשרים, עם דיוק של 95% ולמעלה מזה בזיהוי הדיבור של המתקשר. מהניסיון שנצבר, מדובר בחיסכון של כ-50 ₪ לחודש לכל עובד ומנהל בעסק. החיסכון בכוח אדם תלוי בהיקף השימוש בניתוב שיחות ידני או ב-IVR, שיש בעסק לפני השדרוג לזיהוי קולי.

בחברת ישקר, למשל, נחסכו 10 משרות במעבר לשירות הזיהוי הקולי הזה. שירות ניתוב השיחות בסניפים ובעסקים באמצעות זיהוי קולי כבר פרוס במאות עסקים קטנים וגדולים בארץ ובעולם ומספק למתקשרים חוויית התקשרות חדשנית ונעימה מאי-פעם, לצד חיסכון כלכלי משמעותי לעסק.

מערכת AC Voca (שהיא חלק מהמשפחה, שצמחה בתחום "זיהוי דיבור" מבית אודיוקודס), הותקנה, למשל, במספר לא קטן של מרכזים רפואיים בארץ ובעולם וביניהם: בי"ח רמב"ם, בי"ח שיבא, בי"ח אסותא, בי"ח הילל יפה, מכוני מור ועוד.

המטרה המרכזית של השדרוג: העצמת המרכז הרפואי באמצעות ניתוב שיחות קולי ויצירת חוויית תקשורת חדשנית תוך הפחתת עלויות תפעוליות למרכז הרפואי, עם טכנולוגיית זיהוי קולי חדישות.

מה הייחוד במערכות מבית אודיוקודס לנתב שיחות עסקי וירטואלי ובענן מבוסס זיהוי קולי?

הסיפור המרכזי הוא, כאמור לעיל, של שירות VocaNOM שנולד בסוף העשור הקודם, ומדובר בסיפור ענק של הצלחה עבור אודיוקודס ולקוחותיה.

בעקבות ההצלחה הזו נולדו לה שירותי המשך:

1) שירות הנקרא, כמתואר לעיל, VocaONE, שמיועד בעיקר לארגונים מבוזרים עם שלוחות מבוזרות ברחבי הארץ או בעולם. מדובר בניתוב שיחות חכם לכל השלוחות (ללא תלות במיקומן, בארץ או ברחבי העולם), עם מספר נכנס אחד, ללא IVR.

2) שירות הנקרא, כמתואר לעיל, AC Voca. זה השירות המוביל כיום בעולם לארגונים גדולים ובמיוחד לארגונים הנתונים תחת רגולציות מורכבות, למתן פתרון פנימי וחיצוני לכל סוגי התקשורת הארגונית (פנימה והחוצה), עם צורך בתמיכה בריבוי שפות.

העיקרון ב-3 השירותים הללו (AC Voca, VocaONE, VocaNOM) זהה: ניתוב השיחות לעסקים עפ"י פקודות בקולו של הדובר, תוך "זיהוי הדיבור" של המתקשר. אין צורך להשתמש במקשים (IVR). זה מצוין לעידן, שבו כולם מתקשרים מהסמארטפון שלהם.

בנוסף, ניתן "לתפור" פתרון ספציפי לארגון מסוים לפי צרכים ספציפיים שלו, על בסיס הטכנולוגיות הללו, עם הבטחה, שהמערכת המפותחת עבור הארגון תגיע למעל 95% דיוק של זיהוי הפקודות הקוליות של המשתמשים במערכת, בכל שפה נפוצה בעולם. המערכות הללו מתממשקות לכל מרכזיה נפוצה הקיימת בעולם ולכל מערכת CRM ו-ERP נפוצה הקיימת בעולם.

בד"כ מומלץ להתקין את מערכת "זיהוי קולי" בארגון ביחד עם מערכת מתקדמת ל"הגנת סייבר והגנת הטלפוניה" מבית אודיוקודס דוגמת: Mediant 500 SBC.

המערכת, שמבוססת על "זיהוי דיבור", נמצאת בענן (לפי בחירת הלקוח) ותומכת בעברית ובמבחר שופת נוספות לפי צרכי הלקוח. המערכת הזו כוללת סדרת פתרונות בתחום זיהוי דיבור וניתוב שיחות אוטומטי לעסקים וארגונים, שפותחו בישראל.

אפשר להתנסות במערכת לזמן קצוב ללא עלות ולהתרשם מיכולותיה בטרם קבלת החלטה על רכישתה. מדובר במערכת עם מנוע זיהוי דיבור בפיתוח עצמאי, עם המתמחות מיוחדת בשמות אנשי-קשר, מחלקות, פונקציות ארגוניות וסניפים, ברמת דיוק מאוד גבוהה.

יש למערכת כבר מעל ל-300 לקוחות בישראל ובעולם מכל השווקים ובכל הגדלים. בין הלקוחות ניתן למנות את: טבע, אוסם, פלאפון, ישקר, עיריית תל-אביב, עיריית אשדוד, הטכניון, אגד, אינטל, מוטורולה, ארנסט אנד יאנג ועוד. למעשה, המערכת הזו מתאימה לכל עסק המפעיל אצלו IVR (וכמעט כל העסקים והארגונים בישראל מכל סדר גודל, מפעילים IVR).

למערכת יכולת אינטגרציה פשוטה ומידית מול כל מרכזיה אנלוגית או IP וחיבור לכל שירותי AC Voca ומול כל מערכת IVRאם קיימת כבר בעסק.

המערכת יכולה להיות מותקנת בענן (למשל בענן של אמזון), או בהתקנה בענן מקומי פרטי, או בהתקנה מקומית – On-Premise בתוך העסק, רצוי עם AudioCodes SBC להגנה על התקשורת בעסק, מניעת גניבת שיחות, מניעת האזנה לשיחות ומניעת התקפות סייבר מכל סוג.

המטרה של אודיוקודס היא להפוך את כל התקשורת העסקית בכל האפיקים והערוצים, למבוססת על זיהוי דיבור, תוך חיבור לכל סוגי הטלפונים הנייחים והניידים, לרשתות חברתיות, לאפליקציות עסקיות, לדואר האלקטרוני ועוד.

בראייה הזו, הכל עובר ויעבור שדרוג, כולל ובמיוחד מרכזי שירות לקוחות. המטרה להגיע למענה אוטומטי לחלוטין לפונים. בבי"ח רמב"ם בחיפה בשירות אחד בלבד, הם הגיעו לכך, שכ-90% מהשיחות הנכנסות עברו אוטומטית ליעד בטכנולוגיית זיהוי דיבור, ללא כל מגע אנושי ורק 10% מהשיחות מטופלות ע"י בני אדם.

המיקוד כיום הוא, כאמור, הוספת ה-AI למערכות ויצירת שירותים חדשים. אודיוקודס כבר נמצאת בארגונים גדולים ופותרת להם בעיות של איסוף מידע, שנצבר אצלם בכמויות וללא כל שימוש, על הלקוחות שלהם. בנוסף, מפתחת כלים לניתוח מידע קיים בארגון, כדי לספק את היכולת להפיק מהמידע הזה תובנות. זה כולל, למשל, תיעוד פגישות של אנשי המכירות, מידע רב ערך, שניתן להפיק ממנו המון תובנות והמלצות. אודיוקודס גם פועלת במסגרת מחקרית של הרשות לחדשנות, בפרויקט, שנועד לספק יכולות חדשות של זיהוי דיבור בארגונים.

ברור לאודיוקודס, שהעתיד של המחשוב הארגוני נמצא בטכנולוגיות ה-AI ולכן היא בדרך לכיוון הזה, עם שלל פתרונות הנמצאים כעת בפיתוח.

הגדלת שביעות הרצון של משתמשים היא מניע חזק ביותר המוביל לגידול בשוק הזה. השוק, שאודיוקודס כעת נכנסת אליו, משלב את ה-AI במערכות זיהוי דיבור ויוצר תשתית חדשה המאפשרת לספק פתרונות חדשים, ממש מהרגע הראשון, שהם נכנסו לתחום הזה מול הלקוחות.

מה התחדש במערכת ניתוב השיחות מבוססת זיהוי קולי?

החידוש הטרי ביותר הוא השילוב בין הפתרונות של אודיוקודס לבין הפתרון של מיקרוסופט בשם: Microsoft Teams, שהוא השירות, שיחליף בקרוב את סקייפ לעסקים. מדובר בסדרת מוצרי חומרה ותוכנה, שתוצג בקרוב לשוק הישראלי (ניתן כבר להתנסות בגרסאות המוקדמות של הפתרונות הללו).

פתרון חדש נוסף של אודיוקודס הוא AudioCodes Voice.AI, שירותי קול מבוססי בינה מלאכותית לעסקים וארגונים, שמאפשרים "עבודה קבוצתית" מבוססת זיהוי קול, הקלטת קול וניתוח המשמעויות של הקול בבינה מלאכותית. כך, שהפעילות העסקית הופכת לכמעט אוטומטית לחלוטין. המערכת הזו מצטרפת בעיקר מעל פתרון קודם ומתקדם של חברת אודיוקודס לתחום ההקלטות החכמות בשם: SmartTAP 360⁰.

בנוסף, אודיוקודס החלה לשלב את מערכות המסרים המידיים והרשתות החברתיות בפתרונות שלה. כיום, מהאפליקציה על הסמארטפון לא רק שאפשר לחייג ולהגיע ליעד באמירת השם של היעד בקול, אלא גם לשלוח מסרי ווטסאפ (WhatsApp), מסרונים רגילים (לרבות SMS ו-MMS), דוא"ל ועוד. למעשה, המערכת הפכה למערכת המשלבת יכולות של "עבודה קבוצתית" ו"תקשורת אחודה", עם יכולות של רשתות חברתיות.

כך, המערכות הללו של אודיוקודס מתפתחות כל הזמן לאור הצרכים המשתנים של העסקים בישראל. בנוסף, ניתן לשפר ROI של קמפיינים שיווקיים באמצעות שימוש בכלי ה-BI המסופקים עם המערכת.

תחום זיהוי קולי מזמן יצא מהמשבצת של "Personal Assistance" ("עוזר/ת אישי/ת"), שהחלה לפרוץ לתודעה של הציבור בשירות Siri במכשירי הסמארטפון של אפל. כיום, אפשר למצוא את השירותים הללו בתחומים עסקיים רבים, שמתפתחים כל הזמן, בגלל התחרות, שנפתחה בתחום זה ע"י ענקיות דוגמת אמזון, מיקרוסופט, סמסונג וגוגל.

בעוד מרבית מנועי זיהוי הדיבור הציגו יכולות דיוק של כ-95% כבר לפני כמה שנים, רק לאחרונה (ובעיקר הודות לטכנולוגיות Machine Learning למיניהן), המנועים הפופולריים עושים דרכם לעבר רמת דיוק של 99%. בכך, הטכנולוגיה הזו קיבלה יכולות להמריא ולהיכנס גם למגזר העסקי והארגוני. השירותים הללו מסופקים בד"כ בגישת שירות ענן.

זיהוי קולי בסמארטפון – טיפ

למי שמהסס להיכנס לעולם זיהוי קולי בשירותי ענן, מומלץ להתחיל "בקטן". דהיינו: לבחור מרכזיה של סניף יחסית קטן ולהעביר את השירות של הזיהוי הקולי בה לענן, או לבחור יישום אחד (נניח ניתוב שיחות חכם), שיועבר לקבלת השירות עם זיהוי קולי בענן, כולל במכשירי הסלולר. בחירה בפתרון הנכון דורשת ייעוץ מהמומחים לנושא.

צריך להתחיל בקטן, להתנסות וללמוד איך זה עובד, להפיק לקחים ולהשתפר, עם מבט רחב ומפוקח על המעבר המלא לענן, לאורך ציר זמן של שנה עד שנתיים. זה הכיוון. הטיפ החשוב ביותר כאן הוא: חובה להתנסות בשירותים של ספק שירותי תקשורת מכל הסוגים ובענן, גם אם זה נעשה בקנה מידה מצומצם. ההתנסות בקנה מידה קטן בענן תוכל להוסיף מידע לתהליך קבלת ההחלטות של הארגון.

שורה תחתונה בתחום מערכת זיהוי קולי בסמארטפון בעסקים

הלקוחות, שמתקשרים כיום לעסקים ולארגונים, עושים זאת מהסמארטפון הקיים בידם. לכן, זה מעצבן אותם כשהם נדרשים להקיש ספרות בגישת ה-IVR המיושנת, שהתאימה לעידן מכשיר הטלפון הישן עם כפתורי מספרים גדולים, שלוחצים עליהם לפי תפריט ההנחיות הקולי של נתב השיחות.

הפתרונות של זיהוי דיבור בענן (ובמיוחד כאלה המבוססים על טכנולוגיות זיהוי דיבור) תוך שימוש בסמארטפונים וניתוב שיחות חכם, זוכים כיום להצלחה רבה בשוק העולמי וגם להתחלה די יפה בישראל. זאת, בגלל ההיקף הרחב של היכולות, שבעל העסק מקבל ביישומים החדשים, שמספקים יתרונות עסקיים ברורים.

השוק של הטלפוניה הניידת רווי מתחרים והכוח מצוי בידי הצרכנים. לכן, אין להסתנוור רק מהמחיר ומהיכולות הטכניות של הספק. מומלץ, בכל מקרה, לדרוש מהספק הסכם SLA (הסכם רמת שירות). יש לזכור, שהצרכים של משרד עורכי דין אינם דומים לצרכים של חנות רהיטים, רשת מרכולים, רשות מקומית, חברת הייטק, משרד מומחי ביטוח ופיננסים, או של משרד רואי חשבון.

מכאן, אתה כמנהל או בעל עסק אמור לשאול את עצמך כמה שאלות:

מה הבעיה כי גדולה בעסק, שניתן לקדם אותה באמצעות זיהוי קולי בסמארטפון מתקדם (ובענן)?

אם אתה כבר משתמש במערכת זיהוי קולי בסמארטפון מתקדם (לרבות בענן), ממה אתה לא מרוצה מהפתרון הזה? שתף אותנו.

איך אתה חושב, שאני יכול לעזור לך בתחום בחירת מערכת זיהוי קולי בסמארטפון המתאימה לצרכיך?

לקבלת הצעת מחיר עבור פתרונות זיהוי קולי בסמארטפון

תשובות לשאלות נפוצות

מה זה מערכת זיהוי קולי?

מערכת זיהוי קולי היא תוכנה שמסוגלת לזהות את הדובר, את המילים או את הפקודות שהוא אומר באמצעות ניתוח הקול שלו. ישנם שימושים שונים למערכות זיהוי קולי, כגון אימות ביומטרי, ניווט קולי, עוזרים חכמים וקריאת טקסט. מערכות זיהוי קולי משתמשות בטכנולוגיות כמו למידת מכונה, זיהוי תבניות וביומטריה קולית כדי להבין את הדיבור האנושי.

מהי מערכת זיהוי קולי ביומטרי?

מערכת זיהוי קולי ביומטרית היא מערכת שמסוגלת לזהות את הזהות של אדם על ידי השוואת הקול שלו לתבנית קולית שמאוחסנת במסד נתונים. התבנית הקולית מייצגת את התכונות הייחודיות של הקול של האדם, כגון הטון, הקצב, המשך והאקצנט. מערכות זיהוי קוליות ביומטריות משתמשות בטכנולוגיות כמו למידת מכונה, זיהוי תבניות וביומטריה קולית כדי להבין ולזהות את הדיבור האנושי. מערכות זיהוי קוליות ביומטריות יכולות לשמש למטרות שונות, כגון אימות ביומטרי, ניווט קולי, עוזרים חכמים, קריאת טקסט ועוד.

איך מודדים את ביצועי מערכת ה-ASR (Automatic Speech Recognition)?

ביצועי מערכת ה- ASR (Automatic Speech Recognition) נמדדים בדרך כלל באמצעות שני מדדים עיקריים: דיוק ומהירות. דיוק הוא היכולת של המערכת לזהות באופן נכון את המילים המדוברות ולתעתק אותן לטקסט בלי שגיאות. מהירות היא הזמן שלוקח למערכת להמיר את האודיו לטקסט. בדרך כלל, יש קשר הפוך בין השניים: ככל שהמערכת מהירה יותר, היא פחות מדויקת, ולהיפך. לכן, יש למצוא את האיזון הנכון בין השניים בהתאם למטרה וליישום של המערכת.

ישנם שיטות שונות למדידת דיוק ומהירות של מערכות ASR .

להלן כמה דוגמאות:

– :Word Error Rate (WER) הוא המדד הנפוץ ביותר לדיוק של מערכות ASR . הוא מחשב את ההפרש בין התעתיק המיוצר על ידי המערכת לבין התעתיק הנכון של הדיבור. הוא משווה את מספר השגיאות (הוספות, מחיקות או החלפות) למספר המילים בתעתיק הנכון. הוא מציג את התוצאה באחוזים, כאשר ככל שה-WER נמוך יותר, הדיוק גבוה יותר.

– :Real-Time Factor (RTF) הוא המדד הנפוץ ביותר למהירות של מערכות ASR. הוא מחשב את היחס בין הזמן שלוקח למערכת להמיר את האודיו לטקסט לבין המשך האודיו. הוא מציג את התוצאה במספר עשרוני, כאשר ככל שה-RTF קטן יותר, המהירות גבוהה יותר. אם ה-RTF קטן מ-1, זה אומר שהמערכת יכולה להמיר את האודיו בזמן אמת או מהר יותר. אם ה-RTF גדול מ-1, זה אומר שהמערכת יכולה להמיר את האודיו רק בזמן מאוחר או איטי יותר.

מהם היתרונות בשימוש מערכת זיהוי קולי?

שימוש במערכת זיהוי קולי במרכזיות טלפון לעסקים יכול להביא ליתרונות רבים, כגון:

– חיסכון בעלויות: על ידי אוטומציה של תהליכים מסוימים, ניתן להפחית את הצורך באנשי תמיכה ומוקד, שעולים הרבה כסף לעסק. כמו כן, המערכת פועלת באופן רציף ללא צורך בהפסקות, חופשות או גמול שעות נוספות¹.

– שיפור השירות: על ידי הקשבה לקול ולצרכים של הלקוח, ניתן לנתב אותו ליעד המתאים במהירות וביעילות, בלי להטריד אותו בתפריטים מורכבים או בהמתנה ארוכה. כמו כן, המערכת יכולה להתאים את השיחה לשפה, למבטא ולהקשבה של הלקוח.

– חידוש והבלטה: על ידי הטמעת טכנולוגיה מתקדמת וחכמה, ניתן להרשים את הלקוחות ולהציג את העסק כחדשני ומוביל. כמו כן, ניתן להשתמש במערכת כדי לקדם את המותג, המוצרים או השירותים של העסק באופן יצירתי ומותאם.

5/5 - (2 votes)

מעניין? שתפו ברשתות חברתיות

אודות המחבר:

Michael Pinchas

מיכאל פנחס מהנדס תקשורת בכיר מאוניברסיטת ת"א

מחבר המדריך לפתרונות תקשורת ומחשוב ענן ולרכישת מרכזיות טלפון לעסקים באתרי טלקום אקספרט. מומחה בתחום התקשורת והמחשוב לעסקים מאז שנת 1991. אני מזמין אתכם לעקוב אחרי לקבלת עדכונים וחדשות בעולם התקשורת והמחשוב בפייסבוק | בלינקדאין | וביוטיוב ובמייל [email protected]