fbpx

שירותי תמלול קולי לטקסט – Voice to Text: שירותים העומדים בפני הכחדה! (מידע חדש וטיפים)

שירותי תמלול קולי לטקסט - Voice to Text

שירותי תמלול קולי לטקסט – Voice to Text:
שירותים העומדים בפני הכחדה!

 

שירותים רבים עוברים להיות מופעלים בקולו של האדם (במקום בהקלדה, או בהקשה על מקשים). הפתרונות החדשים הללו עוברים לענן. אולם, בישראל, עדיין "שירותי תמלול" ו"שירותי תמלול פרוטוקולים בחדרי ישיבות" קיימים ומבוקשים.

 

מהם היתרונות של שירותי זיהוי דיבור בענן ולמי זה מתאים?

 

איך זה משתלב בעולם הטלמרקטינג ושירותי התמיכה והמכירות?

 

האם המעבר לענן ומעבר לשימוש ב"בינה מלאכותית" וצ'טבוטים יחסלו את המקצוע הזה?

 

המרת קובץ קול לטקסט – Voice to Text הוא שירות מקצועי מאוד ותיק, שבמדינת ישראל התקדם מעט מאוד, בעיקר בגלל חוסר מודעות של מנהלים והצרכנים של השירות הזה לאן התחום הזה התפתח בשנים האחרונות, ובמיוחד במעבר ל"שירותי ענן".

לא מעט בעלי עסקים, לצד ארגונים ממשלתיים וציבוריים, נעזרים בשירותי תמלול הקלטות וזאת עבור מגוון סיטואציות סביב שירותי הקלטה ותמלול. מי שטרם נתקל בצורך של תמלול שיחה שהוקלטה, יש להניח, שלא יבין עד כמה שירות כמו תמלול אודיו לטקסט ובכלל זה: תמלול הקלטות, תמלול פרוטוקולים מחדרי ישיבות, תמלול שיחות ומפגשים עסקיים, תמלול עדויות ותצהירים בע"פ, תמלול ישיבות, דיונים, בוררויות, ועוד, הוא כה חשוב.

שירותי תמלול שמע לטקסט בעברית מספקים מענה לציבור מכל קשת המגזרים. תמלול משפטי עשוי להוות מרכיב מהותי כחלק מהצלחת תיק בבית המשפט או חקירה, תמלול הקלטות טוב עשוי להיות קריטי בדיון משפטי, שיכול להטות את תוצאות המשפט. תמלול ראיונות יכול לסייע בתהליך של פרסומם בכלי התקשורת ולצרכים של פרסום ועריכת מחקרים, תמלול כנסים והרצאות יכול להציג תיעוד מלא של הדוברים, למי שלא היה באותן הרצאות ומעוניין לקרוא מה היה בהן.

ספקי שירותי תמלול יוצרים נוסח כתוב ומתועד מכל הקלטה, שהם מקבלים (בד"כ קובץ קול מוקלט). זאת, מראיונות עבודה מוקלטים, דרך עבודות מחקר, פגישות עסקיות, סמינריונים והרצאות ועד סיפורי חיים שלמים, שמועברים לספר, או לכתבה במגזין, או לעיתון מודפס או מקוון.

העוסקים בתמלול מבינים את המשמעות של תיעוד מדויק ונאמן למקור ושואפים להעבירו באופן מושלם דרך עבודתם, כולל הגהה מקצועית ע"י מומחי לשון עברית (אם נדרש). המתמללים מקפידים (ככל הניתן) על הבנת החומר, שבקובץ השמע, שהם מקלידים, ובהתאם לכך מתאימים את אופי העבודה ללקוח. לדוגמה: סיפור חיים ניתן לתמלל בצורת סיפור, בעוד שבעבודת שירותי תמלול של עבודת מחקר מדעית, תמלול האזנות סתר לצרכים שונים, תמלול תצהירים, או תמלול עדות לבית משפט, יש צורך לתמלל מילה במילה – ללא עריכה לשונית לעברית תקנית, בדיוק כנשמע בהקלטה, גם אם בדיבור היו שגיאות בעברית.

כאמור לעיל, תמלול היא פעולה המעבירה הקלטות של קול לכתב. על מנת לעשות זאת כראוי (באופן ידני, כמו שנעשה עדיין בישראל), יש צורך בניסיון רב ובמיומנות רבה בתחום הזה. כדי לעשות זאת, על המתמלל לדעת להבחין בין גווני קול שונים, סוגי אינטונציה, מבטאים שונים וכד'. אנשים, שעובדים בתחום זה, עוברים הכשרה מקיפה עוד לפני שמפקידים בידיהם עבודת המרה מורכבת כמו זו.

 

יש כמה סוגים של שירותי תמלול הניתנים כיום בשוק, לרבות:

  • תמלול משפטי. כאן הצורך בדיוק בעבודת התמלול היא מרבית. לעיתים יש צורך ללוות את התמלול בתצהיר של עורך התמלול, תצהיר שהתמלול הוא מלא ומדויק ונאמן באופן מלא למקור התמלול.
  • תמלול ראיונות. מדובר על המרת ראיונות מוקלטים לצורכי עבודות מחקר, ראיונות עיתונאיים, ראיונות לצורכי כתיבת ספר וכיו"ב.
  • תמלול שיחות (שיחות טלפוניות מכל סוג ולכל צורך).
  • תמלול הקלטות (בעיקר הכוונה להקלטות ישנות, בעיקר לצרכים פרטיים ועסקיים).

 

שירותי תמלול קולי לטקסט - Voice to Text

 

 

מי מספק שירותי תמלול קולי לטקסט (Voice to Text) בישראל?

בגלל שהצורך בישראל הוא לתמלול לטקסט בעברית, הכניסה של מערכות אוטומטיות, כמו שקיים במדינות המעבר ובמיוחד באנגלית, די התעכב.

לכן, נוצר בישראל שוק מאוד תחרותי של שירותי תמלול, שכולל בתוכו ספקים קטנים גדולים, במחירים שבין 8 ₪ לעמוד ל-10 ₪ לדקה. הצרכים של תמלול לבית משפט שונים מתמלול לצרכים עסקיים, שאינם משפטיים, ולתמלול ראיונות (למשל לצרכי כלי התקשורת) והרצאות.

בין הספקים בתחום זה ניתן למנות את: "חבר תרגומים" (הגדולים בתחום זה בישראל), "ראיות חותכות", eType ממפתחים גם תוכנות לתמלול אוטומטי, לפי צרכי הלקוחות של החברה), "אלון שירותי תמלול", "זאב ביכלר – תמלול שיחות והקלטות", "אלרן שירותי משרד", "תמליל טק", "תמלול", "פרוטוקול – שירותי תמלול", "TTT", "WeText", "אלון שירותי תמלול", "Sound & Clear", "עמיר אביקסיס תמלול משפטי", "סינטקסט", "אילן שירותי תמלול", "ניר סלע שירותי הקלטה ותמלול", "Text דוט.קום" ועוד.

בגלל ריבוי המתחרים בתחום זה (כי אין בו "חסמי כניסה"), יש אתר להשוואת מחירים בתחום התמלול:

 

לאן הולך שוק שירותי תמלול קולי לטקסט – Voice to Text?

התחום של תמלול ידני אנושי עומד לסיים את חייו. זה שוק בתהליכי הכחדה. הסיבות לכך:

  1. יש כבר בשוק מערכות תוכנה לתמלול, שמבצעות את המשימה הזו לא פחות טוב מבני אדם, אפילו טוב יותר ממתמללים ותיקים ומיומנים.
  2. מערכות חכמות מבוססת AI (ר"ת: Artificial Intelligence – בינה מלאכותית") המבצעות גם תמלול. אלו מערכות, שכבר קיימות בשוק והן טובות פי כמה מהיכולת האנושית הקיימת.

 

מערכות תוכנות לתמלול הקלטות:

כדי לבצע תמלול לא תמיד צריך לשלם לגורם מקצועי חיצוני הרבה כסף. יש מקרים בהם תמלול הקלטות עצמאי עם תוכנת תמלול אוטומטית יכול לספק פתרון לצורך הנדרש. לדוגמא: תמלול שיעורים, הרצאות, ראיונות, עבודות לסטודנטים, תמלול שיחות טלפון אישיות, תמלול שיחות סקייפ או שיחות ועידה שכל הנדרש הוא תמלול לצורך תיעוד פרטי – אפשר לגמרי להתמודד עם משימת התמלול לבד.

אולם, כשיש צורך להמיר קול לטקסט, ויש חשיבות לדיוק והאיכות – מבחינה עסקית או משפטית – מומלץ לפנות לחברת תמלול הקלטות מובילה אמנם לביצוע העבודה בתשלום, אך כאן אין מקום לקחת את הסיכון. חלק מחברות התמלול משתמשות בעצמן בתוכנות תמלול והן פשוט רק בודקות את איכות התמלול והמתמללים רק מתקנים שגיאות בתמלול האוטומטי.

ביצוע משימה כמו תמלול הקלטות אוטומטי יכולה להיות קלה לאחד ומורכבת לאחר. ישנן סיטואציות בהן זה אפשרי להתפשר על איכות התמליל ולתמלל לבד שיחות מוקלטות עם תוכנה חינמית, ומנגד, ישנם מקרים בהם מומלץ להעביר שיחות שהוקלטו לחברת תמלול הקלטות מקצועית.

כדי לתמלל הקלטה עצמאית יש צורך להצטייד במספר פריטים בסיסיים. כדי לבצע את התמלול יש צורך להשיג תוכנת תמלול טובה, שתסייע במלאכה כדי לקצר את התהליך. זו יכולה להיות תכונה הפועלת מקומית במחשב המשתמש או בענן. התצורה המומלצת כיום היא בענן.

 

בין התוכנות הבולטות אפשר לציין את:

א. Express Scribe. זו אחת מתוכנות התמלול המומלצות בעולם בכלל ובישראל בפרט. חברות תמלול מובילות עושות שימוש גם הן בתוכנה זו, בשל הנוחות, שהיא מציעה, ומאפשרת למתמללים לעבוד ביעילות. מדובר בתוכנת תמלול מקצועית לכל דבר והיא מציעה מגוון פתרונות למי שנדרש להמיר קובץ קול \ שמע \ אודיו – למסמך כתוב. התוכנה מוצעת במסלול בתשלום ובמסלול חינמי. לרבים, המסלול החינמי יספק את צרכיהם.

ב. InqScribe. תוכנת תמלול הקלטות המוצעת חינם למשתמשים. גם במקרה זה ישנם מספר סוגי רישיונות שימוש, שניתן לבחור מה מתאים.

מדובר בתוכנת תמלול אינטואיטיבית לשימוש, מאפשרת שימוש בשני יישומים שונים במקביל (ועל כן חוסכת זמן ועלויות), ניתן להוסיף הערות היכן שנדרש, ויש את האפשרות להתאים אישית את היכולות של הכלי למגוון צרכי תמלול שונים.

ג. Speechlogger. תוכנה ושירות בחינם עם הטכנולוגיות המתקדמות ביותר בעולם להבנת דיבור. כולל תמלול אוטומטי ותרגום סימולטני מכל שפה לכל שפה, באמצעות שימוש במנועים המפותחים בגוגל וכלים נוספים ייחודיים. זאת, ללא הרשמה או התחייבות. תמלול הקלטות וקבצי אודיו כולל ייצוא לכתוביות ושמירת זמנים.

 

מערכות חכמות מבוססות AI המבצעות גם תמלול:

רופאים, עורכי דין, קצרני בית המשפט ועיתונאים מעבירים שעות מחייהם בפרקטיקה המייגעת אך ההכרחית לצרכיהם, של תמלול שיחות. כדי להאיץ את התהליך המייגע הזה, פותחו בשנים האחרונות כלים טכנולוגיים שונים המבוססים על מודלים של הבנת שפה טבעית, שמסוגלים להמיר קובץ שמע למלל באופן אוטומטי.

בין המתחרות בתחום הזה נמצאים חברות ענק הכי גדולות בעולם דוגמת: גוגל (שירות Cloud Speech-to-Text), אמזון (עם השירות המאוד מצליח Alexa), IMB (עם השירות המצליח Watson Assistance), מיקרוסופט (עם שירות Cortana), סיילספורס (בפתרונות מתקדמים דוגמת: איינשטיין, Lightning ו- ,(Salesforce Essentials ועוד. אלו חברות המספקות שירותים בענן במודל ה-SaaS (ר"ת: Software as a Service).

 

שירותי תמלול קולי לטקסט - Voice to Text

 

כמה מהפתרונות החדשים בתחום "התמלול החכם" משולב AI:

א. Verbit.AI סטארטאפ ישראלי, שנכנס לתחום זה, שבו פועלות גם ענקיות הטכנולוגיה ובראשן גוגל ואפל. החברה, שהוקמה בסוף 2016, משלבת בין שימוש באלגוריתמים לתמלול אוטומטי בתוספת להעסקת מתמללים אנושיים (פרילינסרים העובדים מהבית \ מרחוק כחלק מהמערכת הזו), במקרים רבים במדינות מתפתחות, והמודל שלה מאפשר לגבות מחירים נמוכים מהמקובל בשוק עבור תמלול מקצועי. בחברה מסבירים, שכל תיקון, שנעשה ע"י המתמללים, מביא לשיפור האלגוריתם בעזרת שימוש בלמידת מכונה. אחרי שהמשתמשים מעלים את קבצי השמע או הסרטונים לזירה, שהקימה ורביט, המתמללים בוחרים את הקובץ, שעליו יעבדו. המערכת "מאזינה" לקובץ ומתמללת אותו, ומסמנת מילים, שהוודאות לגביהן אינה גבוהה. אחר כך הפרילנסרים מבצעים בדיקה נוספת ומשפצים \ מתקנים את הטקסט. על אף הצפיפות בתחום, בוורביט מציינים, שבתוך שנה הצליחו להגיע להכנסות של מיליוני דולרים, כשבין לקוחות החברה נמצאת יוטיוב, שבבעלות גוגל. במערכת מתעניינים גם גורמים מתחום המשפט וספריות וידאו ענקיות המבקשים לבנות ארכיונים. לדברי החברה, הדיוק בתרגום האוטומטי הוא 99% ומי שמעוניין ב-100% משלם טיפה יותר עבור התיקונים, שנעשים ע"י הפרילנסרים, שעובדים עם המערכת הזו.

ב. Over.AI, פתרון המחבר מערכת טלמרקטינג ל"בינה מלאכותית" (AI) ובעצם הופך אותה ממערכת 'לואו טק' מיושנת למערכת מתוחכמת מתחום ההייטק.

לב המערכת פותח ע"י הסטארטאפ Sensiya הישראלי, שנרכש במאי 2016 ע"י חברת    will.i.am האמריקאית (שפיתחה, בין היתר, את קו פתרונות i.am+). הסטארטאפ Sensiya פיתח ומפתח פתרונות מבוססי "אינטליגנציה מלאכותית" \ "בינה מלאכותית".

לטענת המיזם הזה, ניתן לשלב בינה מלאכותית – Artificial Intelligence לתוך כל מערכת טלפוניה, בדגש על מוקדי השירות והטלמרקטינג, וחלק מזה הוא ההוספה של מערכת צ'טבוטים המזהים את קולו של המתקשר ועונים לו מתוך מערכת ממוחשבת, בלי שהמתקשר מרגיש, שהוא מדבר למעשה עם מחשב ולא עם אדם אנושי. יודגש, שכל הצ'טבוטים החכמים הופכים דיבור לטקסט, שזה, למעשה, תמלול השיחה.

כך, לטענת היזמים, משיגים שביעות רצון טובה יותר של המתקשרים ומספקים יכולת "לסגור יותר דילים" בשיחות הטלמרקטינג, השירות והתמיכה של כל עסק.

 

מה מיוחד בפתרון של Over.AI?

הפתרון הזה מספק בבת אחת כמה יכולות לכל מוקד טלפוני:

  • החלפת מערכת ה-IVR המיושנת למערכת חכמה מבוסס "זיהוי קולי" וצ'טבוטים.
  • החלפת מערכת המחשוב המיושנת, שעומדת מאחורי הפעלת המוקד, במערכת חכמה הנמצאת בענן ומבוססת על AI (אינטליגנציה מלאכותית), שלומדת את הלקוחות ויודעת להתאים להם את המענה המתאים והפרסונלי.
  • יכולת ניתוב שיחה בצורה חכמה למוקדן המתאים, או לאיש התמיכה מתאים, במקרה ויש צורך בשיחה אנושית בגלל בעיה או שאלה טכנית ספציפית מצד המתקשר.
  • התממשקות מהירה למערכת בענן, להתנסות ללא עלות (עד 3 עמדות), לרבות חיבור מהיר באמצעות חשבון Gmail של המשתמש במערכת.
  • אין צורך בכל אינטגרציה או בהתקנת מערכות חומרה או תכונה מקומיות בעסק. הכל Plug & Play בקליק של עכבר.
  • המערכת בנויה באינטגרציה מלאה למערכת G Suite של גוגל.
  • יצירת "מוקד ידע" מהיר המבוסס על המידע, שנצבר בשיחות וכן כל מידע ממאגרי מידע קיימים של משתמש במערכת.
  • יכולת הקלטה מובנית ויכולת ניתוח שיחות ואיסוף לוגים מובנה.
  • ניטור כל השיחות בזמן אמת בצורה קלה וברורה.
  • יכולת חיבור שקופה לכל מרכזית IP קיימת, לכל שלוחת טלפון קיימת ולכל סמארטפון קיים, בכל מקום בעולם. בעת הקמת המערכת המשתמש מקבל מספר טלפון וירטואלי (בישראל, ארה"ב או בריטניה), שאותו הוא יכול לקשר לכל מערכת טלפונית אחרת, באמצעות השימוש בפרוטוקול תקני SIP המובנה כבר במערכת.
  • תאימות לכל מערכת הגנה על טלפוניה מסוג SBC הקיימת בשוק (כל עוד היא עונה על תקן SIP).
  • תאימות מלאה למערכות מקבילות ומשלימות ובכללן: Salesforce, אופיס 365, סקייפ לעסקים, Twilio, Vonage ועוד.
  • המערכת תומכת במספר שפות לרבות בעברית.
  • המערכת מאפשרת תהליך למידה לסוכנים, ע"י הצגת נתונים על דברים, שעבדו בתהליך המכירה ומה שלא עבדו. בנוסף, המערכת לומדת את הלקוחות המתקשרים תוך כדי השיחה, ומתאימה את עצמה לתת מענה לצרכים של כל לקוח.

יודגש, ששיחות המכירה לא תיעלמנה מהעולם בעתיד הנראה לעין, כי בסופו של יום, כולנו יצורים אנושיים, חמים, מושפעים וזקוקים לקשר. ניתן לראות את כמות מרכזי הטלמרקטינג והשירות, שנפתחים בשנים האחרונות ע"י חברות ענק בכל העולם וגם בישראל. אלא שהבינה המלאכותית (AI), שנכנסת גם היא לעולם הטלמרקטינג, תעזור להפחית באופן משמעותי את שיחות הסרק ללקוחות לא מעוניינים ותהפוך את שיחות המכירה למאוד רלוונטיות ופרודוקטיביות.

הפתרון החדש מכונה בשם הטכנולוגי: VoAI (על משקל VoIP המוכר מזה שנים בתחום טכנולוגיות הקול) שמשמעו: Voice over Artificial Intelligence. זה השלב הבא באבולוציה של טכנולוגיות הקול, שלב שכבר החל, שלב שבו השיחות הופכות להיות חכמות, מופעלות ע"י צ'טבוטים ורובוטים, מהענן.

ג. ServiceNow. הסוכן  הווירטואלי החדש של ServiceNow מבין ניאונסים של שפה אנושית וז'רגונים מקצועיים, כך, שבין 15% ל-20% מן האינטראקציות השגרתיות, יכולות להיות מנוהלות ע"י הסוכן הווירטואלי ללא כל מעורבות אנושית.

חברת  ServiceNow, מובילה עולמית בתחום של תהליכי אוטומציה חכמים בענן, השיקה פיתוח טכנולוגיית הבנת דיבור חדשה, שמשולב בסוכן הווירטואלי שלה, בגרסה החדשה של Now Platform. טכנולוגיה זו מציעה אינטראקציה קצרה וטבעית יותר, שמשולבת בפתרון אוטומטי בזמן אמת ומשפרת את חווית הלקוח וחווית העובד.

בשונה מבוטים אחרים, הסוכן הווירטואלי של ServiceNow ינהל בקשות של לקוחות או עובדים משלב הפניה ועד מתן הפתרון, כמו למשל, לאחזר סיסמא, לפתוח אירוע, לעבד אישורים ולבדוק מקרים של השבתות מחשוב. בעולם של משאבי אנוש, הסוכן הווירטואלי יקל על עובדי החברה לשלוח בקשות הנוגעות להיעדרות, משכורות, עדכון פרטים אישיים וכו'. ובנושא של שירות לקוחות, הסוכן יקנה ללקוחות את היכולת לבדוק הזמנות או סטטוס של מוצרים, באמצעותו.

סי.ג'י. דסאי, מנהל מוצר בכיר, ServiceNow: "הסוכן הווירטואלי שלנו תומך בדיבור ומוטמע באופן אינהרנטי בפלטפורמה של ServiceNow. יכולת זו מאפשרת ללקוחות שלנו לפתח טווח רחב של יכולות שיחה חכמות, ממשלוח שאלות מהירות ועד לניהול של פעולה עסקית מלאה".

עם הרכישה של חברת Parlo, עליה הכריזה ServiceNow לאחרונה, תשקיע החברה במהלך השנה הקרובה בשיפור היכולות של הסוכן הווירטואלי להבין שפה טבעית (NLU), לרבות ניואנסים של השפה האנושית, הבנה של ז'רגונים מקצועיים, תוכן טכני ועוד.

 

מאפייני הסוכן הווירטואלי של ServiceNow:

  • הסוכן הווירטואלי מספק תשובות טקסטואליות פרסונליות. לדוגמא, כאשר עובד מבקש מכשיר טלפון חדש, הבוט יודע באיזה מכשיר העובד משתמש כרגע, ובאיזו תוכנית, מיהו ספק הטלפון שלו וכד'. מידע מסוג זה מאיץ את התהליך ויוצר חווית שירות פרסונלית.
  • הסוכן הווירטואלי מאפשר לארגון להגיב מהר יותר, תוך מתן תשובות מהירות, אינטראקטיביות, שיכולות להאיץ תהליכים גם בתקופות של עומס. יכולת זו משחררת את הצוות ומאפשרת לו להתמקד במשימות הליבה של העסק.
  • כל לקוח יכול לתכנן תסריט שיחה רלוונטי עבורו, ללא צורך בכתיבת קוד, באמצעות פונקציות פשוטות של "גרור והדבק".
  • עסקים וארגונים יכולים לשתול סוכן ווירטואלי במסגרת שירות ההודעות שלהם, ברשת, במובייל או באפליקציות הודעות פופולריות דוגמת: Microsoft Teams ו- Slack.

 

איך הגענו לתמלול שיחה בענן ולקיום שיחה מלאה בין מכונה לאדם?

החידוש המרכזי הוא המעבר לשימוש בצ'טבוטים. צ'טבוט זה לא רובוט פיזי של ממש, כמו שכבר החלו לממש בכמה מוקדי שירות בעולם, אלא שלב ראשון בתהליך הזה – רובוט תוכנה. הרובוט לומד את הצרכים של האדם מולו הוא פועל ומתאים את עצמו לפונה. כך, שההתפתחות של הרובוט והשירותים, שהוא נותן, תלויים בצרכים של הפונה אליו. ניתן לנהל עם הרובוט הזה שיחה בכתב או בקול (גם בווידיאו) כדי לבצע פעולות או משימות כלשהן. התקשורת הנוחה ביותר עם הרובוט היא באמצעות הסמארטפון.

כל ספקי הפתרונות לתחום מוקדי שירות לקוחות הכריזו, שהם יספקו שירותי צ'טבוט, אבל חברת אוויה הייתה הראשונה בישראל כשהכריזה בתחילת אוגוסט 2016, שהשירות החדש שלה בתחום זה זמין בישראל. חברת אוויה השיקה בעולם כמו גם בישראל את פתרון Avaya Slate – פתרון צ'טבוט למרכזי שירות הלקוחות. כיום, יש כבר ספקים רבים בתחום הזה.

הצ'טבוט ממנף "למידה עצמית" (Machine Learning) של טכנולוגיות "בינה מלאכותית" (AI): הוא מנתח אינטראקציות שונות עם הלקוח, מספק אוטומציה ושירות עצמי ויעיל כמו סוכן בטיפול בלקוחות בזמן אמת.

הצ'טבוטים מאפשרים לשלב בין עולם הווב ועולם המובייל. הם פועלים על גבי פלטפורמות "מסרים מידיים" ומאפשרים לצרוך שירותים ומידע מותאמים אישית, תוך כדי תקשורת דו-כיוונית עם המשתמש בתוך אותה פלטפורמת מסרים, שהמשתמש נמצא בה ותוך שימוש נדבך תקשורת ידוע ופופולרי – מסרוני טקסט (שאפשרי להרחיב אותם לשיחות קול ווידיאו).

ההתפתחויות הטכנולוגיות בתחום ניתוח שפה (Machine Learning) מאפשרות להפוך את הדיאלוג עם הבוט ליותר ויותר פתוח (לא מוגבל לפקודות בלבד) וכנראה לא רחוק היום בו נוכל להנחות את הבוטים בשפה אנושית ולכוון אותם לביצוע משימות ומטלות בכל תחום, שאפשר להעלות על הדעת.

הפרסונליזציה היא המפתח להצלחה של כל פתרון. הפרסונליזציה מגיעה מהמקום, שבו המערכת יודעת את הצרכים של האדם, היכן הוא נמצא, איך הוא מרגיש, מה הוא עשה קודם, מה הוא החליט קודם, מה משפיע עליו ועוד. הכל משתלב. זה דורש שימוש בכלים רבים במקביל כדי להגיע לפרסונליזציה חכמה, יעילה ואפקטיבית.

בלי פרסונליזציה נכונה, אין שום סיכוי לטלמרקטינג להצליח. השיטות הישנות של חיוג לאנשים רק בגלל שיש לעסק את מספר הטלפון שלהם, אינן יעילות והן בזבוז זמן וכסף.

בתחום פיתוח צ'טבוטים יש לא מעט סטארטאפים ישראליים וחברות ישראליות עם פתרונות עובדים במשבצת הזו של צ'טבוטים חכמים, החל מ-Callvu, דרך Jacada (בולטת בשוק), נייס, ורינט (בולטת בשוק), אמדוקס (בולטת בשוק), Viadialog, Nanorep – LogMeIn (בולטת בשוק), Personetics, וכלה באודיו-קודס, Exceed.ai, ויש עוד.

מכאן, ש"צרכנות נבונה" היא שם המשחק כי הכוח נמצא כיום בידי הלקוחות העסקיים.

 

חידושים נוספים לעסקים בתחום הזיהוי הקולי, המרת הקול למסמכים ותמלול קול:

 

תחום זיהוי קולי מזמן יצא מהמשבצת של "Personal Assistance" ("עוזר\ת אישית"), שהחלה לפרוץ לתודעה של הציבור בשירות Siri במכשירי הסמארטפון של אפל. כיום, אפשר למצוא את השירותים הללו בתחומים עסקיים רבים, שמתפתחים כל הזמן.

בעוד מרבית מנועי זיהוי הדיבור הציגו יכולות דיוק של כ-95% כבר לפני כמה שנים, רק לאחרונה (ובעיקר הודות לטכנולוגיות Machine Learning למיניהן), המנועים הפופולריים עושים דרכם לעבר רמת דיוק של 99%. בכך, הטכנולוגיה הזו קיבלה יכולות להמריא ולהיכנס גם למגזר העסקי והארגוני. השירותים הללו מסופקים בד"כ בגישת שירות ענן.

 

טרנדים בולטים במתן שירות באמצעות האינטרנט \ שירותי ענן משולבים בזיהוי דיבור:

 

  • ניתוב שיחות נכנסות חכם לעסקים וארגונים באמצעות זיהוי בקשתו של המחייג (מערכת המחליפה את ה-IVR הוותיק). המובילה בישראל בתחום ניתוב שיחות על בסיס שיחה טבעית והבנת הדובר (לאן הוא מעוניין להגיע בפנייה שלו) היא אודיוקודס, במערכות זיהוי דיבור וניתוב בענן בשם: VocaNOM ו-VocaONE. מדובר ב-2 המערכות הללו (VocaNOM ו-VocaONE) בחיסכון של עד 75% בזמן ההמתנה למתקשרים, עם דיוק של 95% בזיהוי הדיבור של המתקשר. מהניסיון שנצבר, מדובר בחיסכון של כ-50 ₪ לחודש לכל עובד ומנהל בעסק. החיסכון בכוח אדם תלוי בהיקף השימוש בניתוב שיחות ידני או ב-IVR, שיש בעסק לפני השדרוג לזיהוי קולי. בחברת ישקר, למשל, נחסכו 10 משרות במעבר לשירות הזיהוי הקולי הזה. שירות ניתוב השיחות בסניפים ובעסקים באמצעות זיהוי קולי כבר פרוס במאות עסקים קטנים וגדולים בארץ ובעולם ומספק למתקשרים חוויית התקשרות חדשנית ונעימה מאי-פעם, לצד חיסכון כלכלי משמעותי לעסק.
  • שירות IVR בענן במודל ה-SaaS. זו חלופה מבית Gama Operations הישראלית, שמתמחה, בין היתר, בפתרונות IVR. מדובר בפתרון המוצע כשירות וירטואלי בענן, שהלקוחות משלמים עליו כמו על כל שירות בענן (SaaS = Software as a Service) והוא מכונה בשם: Cloud Interactive Voice Response (CIVR) המותקן בענן מקומי או ציבורי לפי רצון העסק. כך, משפרים גם את חוויית השימוש ללקוחות המתקשרים וגם מורידים את העלויות לבעל העסק. התשלום על השימוש הוא רק עפ"י צריכה בפועל של השירות.
  • שירות Call-Back חכם, ובמיוחד כאשר הלקוח ממתין על הקו יותר מ-3 דקות. חברת פון פלוס הישראלית מציעה, שהלקוח לא ימתין על הקו בכלל. אפילו לא דקה. זאת, בכל מגע שלו עם עסק, ארגון או כל CC (ר"ת: Contact Center), כולל בחיוג מאפליקציה סלולרית כלשהי הנמצאת אצלו על הסמארטפון. זה משנה לגמרי את חוויית הלקוח ותצורת הקשר שלו עם ספק השירות אליו הוא מחייג. הפתרון הזה מחליף את זמן ההמתנה של אנשים המתקשרים לעסק, בין אם למרכזיה העסקית ובין אם למוקד שירות מכל סוג, לשירות מסוג Call-Back (חיוג חוזר). בעולם, הפתרון של Fonolo הוא הפתרון הנפוץ ביותר בצפון אמריקה לחיוג חוזר אוטומטי. Fonolo טוענת, שהיא מורידה בלפחות ב-32% את אבדן הלקוחות הנובע מאי קבלת מענה מהיר ממוקד השירות המופעל בשיטה הרגילה, ומשפרת בלפחות ב-20% את שביעות הרצון של הלקוחות מהשירות, שהם מקבלים. לדברי Fonolo, במחקרים, שבוצעו בקרב מתקשרים ל-CC נמצא, ש-75% מהמתקשרים מעדיפים לקבל שירות Call-Back מאשר להמתין ולעבור דרך תפריטי IVR. עפ"י המחקרים, שערכה החברה, 90% מהלקוחות נעשים עצבניים או מתוסכלים כאשר הם נאלצים להמתין יותר מדקה למענה ב-CC. מכאן, שה-ROI על שירות Call-Back אוטומטי מבוסס זיהוי קולי הוא ברור, די מהיר ומדיד.
  • שירות לקוחות מלא בקול, כולל ביצוע תהליכי מכירה של מוצרים ושירותים. פתרון בולט בישראל הוא של חברת O-T-Tech. זו מערכת המספקת לשירות לקוחות טלפוני מלא, שמנוהל באמצעות זיהוי קולי. חברת O-T-Tech מספקת שירות המופעל כבר אצל לקוחות רבים, גדולים וקטנים בארץ ובעולם ומאפשר ללקוחות לבצע הזמנות, לשלם בכרטיס אשראי, לברר סטטוס ועוד. כל זאת, תוך כדי דיבור רגיל בדומה לשיחה עם נציג. הפניית העבודה היומיומית למערכת נעשית אוטומטית. העובדים האנושיים יכולים להתמקד ולהתפנות לעבודה מקצועית יותר ולטפל באלה, שלא קיבלו מענה מהמכונה האוטומטית. הלקוחות יכולים להגיד את מבוקשם ללא צורך בהקשה על מקשי הטלפון. אין צורך בתהליכי גיוס, הדרכה והכשרה שוטפת לנציגי השירות המתפעלים מערכת כזו. המערכת מתחברת למערכות ה-CRM וה-ERP של הארגון לצורך מסירת המידע וביצוע העדכונים הנדרשים. ל-O-T-tech יש מערכות, שנבנו עבור עולמות ורטיקליים דוגמת: מערכת הרפואה, מערכת הבנקאות, מערכת בתי המשפט, מערכות תשלומים בכרטיסי אשראי ועוד. למעשה, ניתן להתאים את המערכת לכל שוק ולכל סוג של שירות.

 

חידושים מעניינים נוספים בתחום זיהוי דיבור לעסקים ותמלול שיחות:

אחד החידושים המעניינים הוא שירות הפיכת קולו של המדבר למסמך כתוב. הפתרון הנפוץ ביותר בשוק כיום הוא של חברת Speechmatics, מיזם בריטי של שירות המופעל בענן ומבוסס AI וניתן להשתמש בו בגישת ה-SaaS. השיטה: מעלים את קובץ הקלטת הקול אותו רוצים להפוך למסמך, והמערכת תוך מספר שניות הופכת את הדיבור למסמך ומחזירה את המסמך לשולח. המערכת תומכת ב-75 שפות (אבל עדיין לא בעברית).

החוזק של המערכת הזו הוא באנגלית, עם התאמה ל-40 ניבים וגרסאות של אנגלית, שיש במדינות העולם השונות.

כיום, כמה מערכות עיתונים בישראל משתמשות בשירות הזה, כדי להקליט ולתמלל אוטומטית את הדברים של מרואיינים, מרצים ודוברים המדברים בשפה זרה. כמו כן המערכת משמשת בעלי תפקידים רבים (החל מעורכי דין וכלה ברופאים), שמעוניינים להפוך את הדיבור שלהם למסמך כתוב, מבלי להקליד את המסמך במקלדת מחשב.

בנוסף, המערכת משמשת ככלי עבודה לשיחות ועידה ולחברות רב לאומיות, או לחברות עם שולחות וסניפים, כשמעוניינים להפוך את השיחות בין המשתתפים בשיחה למסמך כתוב, במהירות, מבלי צורך להפעיל שירותי תמלול ורישום \ תיעוד שיחה. זה הופך את תהליכי ה"עבודה הקבוצתית" ליעילים, כשניתן לתעד בקלות מה דובר ומה סוכם בכל מפגש, בכתב, בקלות ובמהירות, ממש בסיום המפגש.

המערכת של Speechmatics עובדת בהצפנה קצה לקצה והמידע, שקיים בקבצים הנעים ברשת, מוגן ברמה המתאימה לתקנים המחמירים ביותר של אבטחת מידע.

ניתן להוסיף "חותמת זמן" על המסמך הכתוב, כדי שהמסמך יהיה תקף מבחינה משפטית (חשוב, למשל, בהסכמים, מסמכים בעלי חשיבות משפטית, במסמכים המכילים החלטות חשובות ובמקרים של קבלת החלטות התלויות בציר הזמן).

התשלום על השירות נעשה לפי שימוש, ותלוי בכמות דקות השיחה, שיש להפוך למסמך כתוב. מינימום עלות הוא 10 ליש"ט ל-166 דקות שיחה. כלומר: העלות של דקת שיחה מתחילה ב-6 פני והעלות הזו יורדת עד 4 פני לדקה, בכמויות גדולות של דקות שיחה, שיש להמיר אותם למסמך כתוב. אין מגבלה בגודל הקבצים הנשלחים להמרה למסמך כתוב, אולם, מומלץ למשתמשים לא לשלוח קבצים, שזמן העלאה שלהם לענן השירות יכול לקחת יותר משעתיים (בגלל חשש לניתוק התקשורת או שיבוש בהעברה של הקובץ).

בנוסף לשירות בענן, המערכת יכולה להיות מותקנת בענן מקומי, או אפילו בשרת מקומי, עם API למערכות תוכנה פנימיות הנמצאות בעסק. כך, שניתן להפעיל את המערכת ישירות ממערכת קיימת, למשל מערכת CRM או מערכת דוא"ל, מערכת מרכזיה, מערכת שירות לקוחות וכיו"ב.

המערכת הזו יכולה לקבל גם קובצי וידיאו, והיא מחלצת את הקול מתוך קובץ הווידיאו. ניתן לשלוח כל קובץ, שיש בו קול, למשל, הקלטות מהרדיו, הקלטות של פודקאסטים ועוד.

המערכת יודעת לזהות שפה באופן אוטומטי ויכולה לזהות גם מילים בשפות שונות (המערכת תומכת כבר ב-20 שפות שונות), כשהדובר מערבב שפות בזמן הדיבור, או כשיש ערבוב שפות בין דוברים, תופעה הקיימת במפגשים בין אנשים הדוברים שפות שונות ומעדיפים לדבר בשפת האם שלהם או בשפה אחרת הנוחה להם או שמערבבים ביטויים או משפטים בשפה אחרת בתוך השפה בה הם משוחחים.

המערכת הזו יכולה לשמש גם לצרכי לימוד, למשל: הפיכת קולו של המרצה באוניברסיטה לחומר כתוב, שסטודנטים, שלא השתתפו בשיעור, יכולים לקרוא. כ"כ, המערכת יכולה לשמש ככלי עזר לחרשים, שלא יכולים לראות את פניו של הדובר. שימושים נוספים למערכת: עריכת סקרים בקול והפיכתם למסמך כתוב במהירות, חיפוש קולי במאגרי מידע עסקיים, תמיכה למשתמשים ועובדים חדשים בניווט באתרים ובאפליקציות ועוד.

 

שורה תחתונה בתחום בחירת פתרונות שירותי תמלול קולי לטקסט:

רכישת פתרונות שירותי תמלול ידניים ושירותי תמלול מתקדמים בענן (לרבות שירותים מבוססי AI), כמו כל רכישה בעסק, צריכה להיעשות רק לאחר בחינת צרכי המשתמשים בעסק. יש לשקול גם את רמת האמינות של הספק והאם אפשר לקבל ממנו אחריות ושירות ברמה נאותה (SLA), והאם המערכת הנרכשת פועלת בעברית (ובשפות נוספות הנדרשות בישראל דוגמת: ערבית, רוסית, אמהרית, אנגלית, צרפתית וכיו"ב).

 

לכן נשאלות כאן השאלות:

מה הבעיה הכי גדולה הקיימת בצרכי התמלול שלך, שאתה מאמין, שתוכל לפתור באמצעות מעבר לתמלול חכם בענן?

 אם אתה כבר משתמש במערכת תמלול חכמה בענן, ממה אתה לא מרוצה מפתרון הזה? שתף אותנו.

 איך אתה חושב, שאני יכול לעזור לך בבחירת מערכת תמלול חכמה בענן המתאימה לצרכיך?

 (!How to Transcribe Audio to Text (Video Transcription Tutorial

 

 

פוסטים נוספים