00:00:00: Herzlich willkommen bei Bits Bots und Business, dem Podcast über digitale Innovationen smarte Geschäftsmodelle und spannende Trends aus IT, Collaboration und Telefonie. Ich bin Daniel Seebach, euer Podcast-Host und freue mich heute mit euch über eine Technologie zu sprechen, die die Telefonie von Grund auf verändert. Und zwar sind das KI-Voicebots. Was früher noch Science-Fiction war, ist nämlich heute schon Realität. Intelligente Sprachassistenten die am Telefon natürliche Gespräche führen... Kundenanfragen beantworten und Unternehmen dabei helfen, ihren Service zu revolutionieren. Stellt euch vor, ein Kunde ruft an und statt einer Warteschlange oder eines komplizierten Menüs begrüßt ihn eine freundliche Stimme, die seine Anfrage versteht, intelligent antwortet und sogar komplexe Probleme lösen kann.
Und das rund um die Uhr und genau das ermöglichen KI VoiceBots heute schon. In dieser Folge erfahrt ihr, wie diese Technologie funktioniert, Welche beeindruckenden Erfolgsgeschichten dahinter stehen, welche Herausforderungen es gibt und warum Voicebots die Zukunft der Telefonie prägen: werden. Doch fangen wir erstmal an, was sind denn eigentlich Voicebots und warum boomen sie gerade jetzt? Ein KI-Voiceboard ist ein sprachgesteuertes System, das mithilfe künstlicher Intelligenz natürliche Gespräche am Telefon führen kann. Das heißt, wir können irgendwo anrufen und wir sprechen mit einer KI, die ziemlich echt klingt und vielleicht noch ein bisschen nach KI klingt, aber grundsätzlich schon sehr, sehr menschlich klingt und wir haben das Gefühl, dass uns da jemand helfen kann. Und im Gegensatz zu traditionellen Sprachmenüs die normalerweise relativ doof sind und beispielsweise Tastentöne erkennen können, verstehen VoiceBots sogar den Kontext, erkennen Emotionen, also bin ich jetzt eher wütend bin ich total gut gelaunt oder bin ich neutral gelaunt, das ist das Sentiment Analysis, oder reagieren bzw.
und reagieren flexibel auf unterschiedliche Anfragen die eben reinkommen die man natürlich auch definieren muss bei der Einrichtung aber dazu kommen wir später nochmal. Der technologische Durchbruch kam: jetzt. Warum? Das ist ganz einfach. Die Antwort liegt in drei entscheidenden Entwicklungen. Zum einen der Geschwindigkeit, denn moderne KI-Modelle antworten bereits in unter einer halben Sekunde. Das muss man sich wirklich mal auf der Zunge zergehen lassen. Ich spreche in ein Telefon rein oder rufe eine Hotline an und spreche ins Telefon Und die KI kann so schnell meine Anfrage prozessieren und mir eine Antwort geben, dass das in unter einer halben Sekunde passiert. Das kann jetzt nicht jedes System. Das ist wirklich jetzt die Bestzeit, aber das wird ja tendenziell immer besser. Und das macht Gespräche endlich natürlich. Jeder von uns kennt das, wenn wir ein Gespräch führen und wir warten zwei, drei Sekunden bis wir Feedback von der anderen Seite bekommen. Das ist ein total unnatürliches Gespräch da haben wir eigentlich keine Lust drauf. Also zumindest ist es bei mir so, wenn ich so ein Gespräch führe Dann habe ich eigentlich sehr viel Lust aufzulegen, weil das so asynchron ist, dieses Gespräch dass ich da keine Lust drauf habe oder so schwergängig Das ist der erste Punkt, also die Geschwindigkeit. Der zweite Punkt ist die Natürlichkeit.
KI-Stimmen: klingen heute täuschend echt und empathisch und jeder, der das nicht glaubt der kann sich gerne mal Eleven Labs angucken, die haben super KI-Stimmen, super synthetisierte Stimmen. Die sehr, sehr echt klingen und mit denen es eigentlich Spaß macht zu telefonieren. Also man hat wirklich das Gefühl, da könnte wirklich ein Mensch hinter stecken. Das erkennt man manchmal noch, dass es kein Mensch ist, aber in sehr vielen Gesprächen merkt man schon, okay, da ist schon sehr, sehr viel Menschlichkeit dabei, obwohl es eine KI-Stimme ist. Das ist der zweite Punkt, die Natürlichkeit. Der dritte Punkt ist die Intelligenz. Fortschritte in der Natural Language Processing ermöglichen jetzt echtes Sprachverständnis Also ich rufe irgendwo an und ich sage, ja, ich habe ein Problem mit meinem Telefon, wer kann mir denn hier helfen und... Die KI erkennt, was ich möchte. Wahrscheinlich habe ich einen Support-Fall und dann entweder, je nachdem, wie es definiert ist, kriege ich dann sofort Hilfe von der KI oder werde eben weitergeleitet in den Service zum Beispiel. Das ist der einfachste Fall. Ein KI-Rezeptionist, der erkennt, was möchte der Anrufer und der dann eben weiterleiten kann.
Und das sind die drei: Punkte, die für den Durchbruch gesorgt haben. Einmal die Geschwindigkeit, die Natürlichkeit und die Intelligenz Und der Markt für diese Technologie ist groß Definitiv da. Die Zahlen sprechen nämlich für sich. Der globale Markt für Sprach und Spracherkennung wächst von ca. 15 Milliarden US-Dollar aus dem Jahr 2024 auf prognostizierte 81 Milliarden US-Dollar bis 2032. Eine unfassbar große Zahl da ist ein riesiger Markt und deswegen kommen natürlich auch ganz viele Startups auf die Idee, genau da jetzt einzusteigen und ein Produkt anzubieten und da gibt es jetzt wirklich fast schon von Woche zu Woche mehr Anbieter Die in dieses Business einsteigen. Die Steigerung, von der ich gerade gesprochen habe, entspricht ungefähr einer jährlichen Wachstumsrate von 23%, was natürlich schon immens ist.
In Deutschland nutzen bereits 27% der Bevölkerung regelmäßig KI-Assistenten Die sind ja in sehr, sehr vielen Lösungen schon drin, jetzt angefangen von Chat-GPT, aber auch zum Beispiel in Lösungen wie Webex ist KI natürlich auch schon standardmäßig enthalten und die sorgen in: Meetings und in Anrufen dafür, dass wir smarte Funktionen haben. Wie funktionieren KI-Voicebots technisch? Da gibt es eigentlich drei Säulen. Also moderne Voicebots basieren auf drei Komponenten Die erste wäre die Spracherkennung. Das gesprochene Wort wird in Text umgewandelt also Speech-to-Text. Dann gibt es die Sprachverarbeitung. Das heißt, die KI versteht die Bedeutung und die Absicht und die Sprachsynthese, die Antwort wird in natürlich klingelnde Sprache verwandelt. Das natürlich klar. Die KI muss verstehen, was möchten wir. Das muss die in irgendeiner lesbaren Form bekommen. Die muss die Absicht erkennen durch smarte Technologien in der Sprachverarbeitung und natürlich muss das auch wieder sauber zurückgegeben werden, denn Keiner von uns liebt Roboter-Stimmen am anderen Ende.
Wir wollen immer ein natürlich klingendes Gespräch haben und dafür gibt es dann eben die Sprachsynthese, die wirklich auf einem sehr, sehr guten Niveau ist und ich glaube, es dauert nicht mehr lange dann können wir das schon gar nicht mehr unterscheiden ob da jetzt ein Bot spricht oder ein KI spricht oder wirklich ein echter Mensch.: Was moderne Void-Spots besonders macht, ist die KI-Intelligenz Das heißt, sie können... Und das ist wirklich krass Kontext über mehrere Gesprächsrunden hinweg behalten. Da möchte ich direkt mal ein Beispiel nennen. Jeder von uns kennt das. Ich habe da sogar ein konkretes Beispiel. Ich habe mal bei einer Service-Hotline angerufen, war auf der Autobahn und war da relativ lange in der Warteschlange, habe dann endlich jemanden dran gehabt, musste dem das erklären, wurde auch ein paar Mal weitergeleitet, musste das also mehrmals erklären. Und dann hatte ich einen Verbindungsabbruch. Das war wahrscheinlich, das war eine Vermutung durch den Sendemast auf der Autobahn, der vielleicht nicht ganz so gut erreichbar war. Auf jeden Fall war das Gespräch weg. Und dann musste ich nochmal anrufen. Ich musste nochmal warten und ich musste nochmal alles mehrfach erklären.
Und das war sehr, sehr frustrierend. Und wenn ihr euch heute überlegt, ihr ruft irgendwo an und man erkennt direkt, ah ok, das war ja das und das Thema und der VoiceBot... Weiß quasi noch, was ihr wolltet oder der Voicebot kann euch vielleicht auch direkt wieder mit dem Agenten: verbinden, mit dem ihr gesprochen habt oder der kann quasi den kompletten Kontext wiedererkennen und weiterverwerten Da gibt es natürlich verschiedene Beispiele Aber das ist eine sehr, sehr schöne Sache, die KI-Boards natürlich kennen. KI-Boards können auch Emotionen in der Stimme erkennen und auch entsprechend reagieren. Also man kann erkennen, ist man jetzt hier besonders sauer, dann kann man vielleicht auch entweder besonders empathisch reagieren oder vielleicht auch an einen Agenten weiterleiten wo man weiß, der ist super gut, das ist unser bester Third-Level-Supporter, der ist super empathisch und der kann dem Kunden helfen und dann wird der hoffentlich nicht mehr so sauer sein. Also da kann man wirklich den... Die Sentiment erkennen und darauf basierend eben Ja, Dinge passieren lassen. Und natürlich, dass komplexe Anfragen verstanden werden können, auch wenn sie umgangssprachlich formuliert sind. Das kennen wir natürlich alle. Wir formulieren Dinge anders, als der Anbieter sie formulieren würde.
Das heißt, wenn wir jetzt irgendwo anrufen, dann formulieren wir das in unseren eigenen Worten kennen vielleicht auch gar nicht die Fachterminologie oder: wissen einfach nicht so genau, wie man das darstellt Thema jetzt ganz konkret beschreibt und beschreiben es irgendwie in der Umgangssprache und ja, die KI kann das erkennen und das ist natürlich eine tolle Sache, dass die KI dann direkt weiß, okay, das hat jetzt hier, es ist jetzt folgendes Problem, obwohl man das vielleicht nochmal ein bisschen komischer oder umgangssprachlicher erklärt hat, also auch das ist eine coole Sache. Die DKI mittlerweile kann. Und die DKI kann natürlich aus dem, was passiert, aus jedem Anruf aus jeder Interaktion lernen und sich kontinuierlich verbessern. Wenn der Kunde irgendwie immer etwas umgangssprachlich formuliert und das vielleicht erstmal nicht verstanden hat, irgendwann lernt die DKI das und versteht das.
Das heißt, da wird es eine kontinuierliche Weiterentwicklung geben und je länger das System im Einsatz ist, desto besser wird das System. Und das ist, glaube ich auch eine sehr, sehr wichtige Sache und auch eine sehr coole Sache. Es gibt auch Integrationen in Unternehmenssysteme Das heißt, Voicebots sind im Regelfall keine isolierten Systeme Sie integrieren sich nahtlos in CRM-Systeme Datenbanken und vor allem: in die bestehende Telefonie-Infrastruktur. Und das ermöglicht dann besonders personalisierte Gespräche, basierend auf zum Beispiel der Kundenhistorie und Echtzeitdaten die wir abrufen können. Dafür möchte ich auch gleich ein paar Beispiele nennen. Wo brillieren denn die Voicebots? Also was sind denn wirklich jetzt praktische Anwendungsfälle? Es gibt einen Anbieter der wollte Wasserzählerstände erfassen und das ist wirklich ein Praxisbeispiel und dieser Voicebot, der erfasst Wasserzählerstände für einen Versorgungsbetrieb und das heißt, da ruft jemand an und Entweder, da gibt es sogar beide Richtungen, entweder die Nummer wird angerufen vom Versorgungsbetrieb oder es wird sogar ein Outbound-Telefonat gemacht.
Also der Versorgungsbetrieb wird automatisiert über die KI ein ausgehendes Gespräch führen und den Kunden anrufen. In beiden Fällen hat der Kunde dann die Möglichkeit, sich über einen Voicebot zu navigieren bzw. mit dem zu sprechen. Und dort dann eben den Wasserzählerstand anzugeben, der dann: automatisch in das System des Versorgungsbetriebs läuft, sodass wirklich keine menschliche Interaktion mehr möglich ist. Man muss nicht mehr mit einem Menschen sprechen, der das dann wirklich, der dann fragt ja wer sind Sie denn und wo wohnen Sie denn und nennen Sie mir bitte die Wasserzählerstandsnummer und nennen Sie mir bitte den Wasserzählerstand und dann, ah ich habe Sie nicht verstanden, können Sie das nochmal wiederholen Und das ist natürlich sehr, sehr aufwendig das ist eine sich wiederholende Tätigkeit die sehr einfach ist. Und die wurde hier in dem Praxisbeispiel automatisiert, sodass das komplett über die KI gemacht wird. Das Ergebnis war, dass wir nach wenigen Wochen weniger als 10% der Anrufe an menschliche Agenten weiterleiten mussten und in der Woche 2022 lag die Weiterleitungsquote sogar nur bei 2%. Das heißt, hier wurde minimaler menschlicher...
Aufwand betrieben, um diese Wasserzählerstände zu erfassen. Das war die Blue Partner GmbH, für denjenigen, der es auch mal nachgoogeln möchte. Das ist ein Praxisbeispiel von einem Anbieter für Voice-KI-Bots und das ist, glaube ich, eine echt coole Sache, wo wir auch schon merken, dass wir da den: Menschen, der das normalerweise gemacht hätte, vielleicht viel sinnvoller einsetzen können, als immer wieder dasselbe zu tun und Wasserzählerstände zu erfassen. Da gibt es wirklich vielfältige Einsatzbereiche und für mich der sinnvollste Einsatzbereich ist wirklich erstmal der Kundensupport wo man den First-Level-Support abdecken kann, ganz einfache Fragen beantworten lassen kann, also vielleicht so einen kleinen FAQ-Bot oder einen kleinen Bot, der eben... Sich Informationen über eine Webseite oder eine Online-Hilfe scraped und diese Informationen dann leicht verständlich übers Telefon wiedergeben kann. Und wenn so einfache Fragen kommen, kann der VoiceBot davon schon ein paar abfangen. Und das muss man sich wirklich auch vor Augen halten. Selbst wenn der VoiceBot vielleicht 5% oder 10% der Anrufe Durch KI beantwortete Anrufe abfängt, die dann eben nicht mehr weitergeleitet werden an einen echten First-Level-Support-Mitarbeiter, dann haben wir schon sehr viel gewonnen, weil wir müssen uns mal überlegen, 5 bis 10 Prozent ist eine Menge.
Wenn wir bedenken wir haben wirklich 10 Prozent und wir haben 10: Mitarbeiter, dann haben wir quasi einen Mitarbeiter, der sich viel sinnvolleren Aufgaben widmen kann und der sich vielleicht auch länger mit komplexeren Problemen beschäftigen kann oder der vielleicht in den Second-Level geht Wechseln kann und dort dann wirklich die komplizierten Anfragen machen kann. Also das ist wirklich signifikant was wir dann gewinnen können. Abgesehen davon kann der Service dann auch erstmal in verschiedenen Sprachen stattfinden und auch 24-7 passieren, denn der KI-Voiceboard ist immer da. Das heißt, wir haben jetzt nicht mehr Geschäftszeiten an die wir uns orientieren müssen, wo wir Menschen in der Hotline sitzen haben, sondern wir können das auch in der Nacht machen. 24-7, sogar am Sonntag kann jemand anrufen um 23 Uhr und bekommt von der KI eine Hilfe. Und wenn vielleicht die Anfrage dann nicht beantwortet werden kann, dann können wir auf eine Voicemail weiterleiten. Super einfache Anwendungswahl aber ich glaube, eure Kunden werden es euch danken, wenn ihr das macht Einführt.
Und von diesen Beispielen gibt es super, super viele Beispiele, die werden wir nochmal in einer gesonderten Folge besprechen. Da gibt es eine ganze: Menge an Beispielen Use Cases und auch Ideen für die Zukunft, was man vielleicht noch machen kann. Aber grundsätzlich habe ich ja jetzt hier schon mal zwei, drei genannt und ich glaube, die veranschaulichen ganz gut, dass so etwas sinnvoll ist. Ja, die finanziellen Vorteile die können wirklich dramatisch sein. Ich habe ja eben schon gesagt, wenn wir einfach nur bedenken dass wir 5-10% der Anrufe abfangen können, dann können wir auch starke Kosten dazu, oder Kosten reduzieren, also wir haben eine starke Kostenreduktion Zum Beispiel auch in Kontaktcentern wo dann wirklich kein Agent mehr sprechen muss, weil das Ganze durch KI automatisiert wird.
Der Personalbedarf in ganz einfachen Hotlines, wo immer wiederkehrende Tätigkeiten oder Anrufe stattfinden müssen, der kann wirklich, also bei manchen Beispielen sogar bis zu 90 Prozent reduziert werden und diese Mitarbeiter werden an anderer Stelle einfach viel, viel weniger Sinnvoller eingesetzt oder vielleicht auch Aufgaben die sich immer wiederholen Routineaufgaben wie zum: Beispiel, ich rufe an und möchte meinen Namen ändern oder ich möchte meinen Kontostand erfahren oder ich möchte verschiedene Dinge machen, die wirklich sehr einfach sind, die wir natürlich integrieren müssen, die aber eigentlich relativ einfach sind, zumindest aus Kundensicht. Die können wir komplett. Automatisieren und in vielen Beispielen die ich auch schon gefunden habe, steht zum Beispiel, dass die Kundenzufriedenheit sich sogar dadurch erhöht Man würde ja jetzt im ersten Moment denken, dass wenn ich jetzt mit einem Bot spreche oder mit einer KI spreche, dass man das jetzt erstmal nicht so gut findet, aber das Gegenteil ist der Fall. Wird steigen weil wir erstmal eine bessere Verfügbarkeit haben. Es geht ja direkt jemand dran, wir müssen nicht warten. Wir haben möglicherweise auch internationale Callcenter oder vielleicht auch in Deutschland einfach einen englischsprachigen Menschen, der anruft, wo der Bot einfach auch Englisch sprechen kann und trotzdem präzise Antworten geben kann.
Und es werden womöglich auch weniger Fehler gemacht, vor allem bei Standardprozessen. Dann bleiben wir mal bei der: Wasserzählerstandserfassung oder vielleicht bei einfachen... Bei einfachen Änderungen im System, ich möchte meinen Namen ändern, ich möchte meine Kontonummer ändern, ich möchte mich irgendwie legitimieren etc. Das kann man ja alles heute mit dem KI-Voiceboard machen und dadurch kann man die Fehler reduzieren, weil das eben über eine Maschine gemacht wird und die Zeiten, die ein Anrufer in der Leitung bleibt, die verkürzen sich auch. Selbst wenn man an einen Agenten weiterleitet, dann wurde schon so viel Vorarbeit geleistet dass das Gespräch definitiv kürzer sein wird, als wenn der Agent jetzt nochmal alles von vornherein erfassen würde.
Eine repräsentative Umfrage in Österreich zeigt sogar sehr, sehr spannende Trends Gibt hier eine generationsspezifische Akzeptanz Und zwar, fand ich super spannend, 65% der 16- bis 29-Jährigen stehen VoiceBots offen gegenüber.: 37,4% der 50- bis 65-Jährigen akzeptieren die Technologie sogar, hätte ich nicht gedacht. Und 40% der Gesamtbevölkerung finden VoiceBots im Kundenservice. Akzeptabel und das zeigt einfach die wachsende Präferenz für die Sprachkommunikation. Super überraschend fand ich, dass 71% der Generation Z sehen Live-Anrufe als den schnellsten Weg zur Problemlösung. Das war Teil einer McKinsey-Studie und das ist wirklich krass denn scheinbar profitieren hier VoiceBots klar von der Renaissance der Sprachkommunikation oder wir sprechen hier von der Renaissance der Sprachkommunikation.
Wirklich wirklich spannend. Und entscheidend für die Akzeptanz sind vier Dinge. Einmal die natürlich klingende Stimme, die schnellen Reaktionszeiten, kompetente Antworten und die nahtlose Weiterleitung einem Menschen bei komplexen Anfragen Das dürfen wir auch nicht vergessen, wenn die KI nicht helfen kann und die KI kann wirklich jetzt kein Second Level Support anbieten oder unterstützen Einen Second Level Support komplett übernehmen, so: weit sind wir noch nicht und an der Stelle muss die KI einfach erkennen, okay, hier komme ich nicht weiter, hier brauche ich gar nicht weiter versuchen eine Lösung zu finden, hier leite ich jetzt an einen Second Level Supporter weiter, der uns eben weiterhelfen kann. Und genau das muss die KI heute auch machen und das kann man auch so einstellen und dann funktioniert das auch wunderbar und dann verschreckt man auch niemanden weil man wirklich alle abholt. Die einen holt man direkt über die KI ab und die anderen leitet man eben weiter und lässt man wirklich von Menschen helfen. Es gibt aber immer noch einige Herausforderungen mit denen diese KI-Voicebots heute noch zu kämpfen haben. Das ist zum Beispiel die Spracherkennung bei Dialekten oder Akzenten. Das ist, wenn ich jetzt an Bayerisch oder Kölsch denke, da wird die KI nicht immer direkt erkennen, was ich möchte, wobei ich schon sehr schöne kölsche Gespräche mit Chat-TBT führen konnte, aber grundsätzlich wird da nicht immer alles verstanden.
Es ist natürlich so, dass moderne Systeme sich da auch kontinuierlich verbessern. Natürlich wird auch ein umfangreiches Training benötigt: aber das wird sich kontinuierlich verbessern und ich glaube, dieses Problem wird es auf kurz oder lang auch gar nicht mehr geben. Selbst wenn ich den tiefsten Akzent habe aus irgendeinem Dorf dann wird man mich verstehen können. Das ist einfach nur eine Frage der Zeit. Es gibt auch noch Problematiken oder Herausforderungen bei dem Kontextverständnis Also komplexe mehrdeutige Anfragen bleiben immer noch herausfordernd. Das heißt, wenn die KI nicht ganz genau erkennen kann, was meint derjenige denn, dann weiß die KI das halt einfach nicht, dann weiß die KI auch nicht, was sie machen muss. Und diesen Fall muss man einfach nur definieren. Entweder muss man sagen, dass die KI dann nochmal genauer nachhaken muss, damit sie wirklich konkret eine eindeutige Anfrage bekommt oder dass eben an Menschen weitergeleitet wird. Aber das kann man ja heute auch schon sehr, sehr gut abfangen. Und die Emotionserkennung, die habe ich ja eben schon mal erwähnt, die gibt es schon, die ist in Teilbereichen auch ein bisschen verpönt weil man das nicht möchte und das wirft natürlich auch nochmal Fragen in.
In Richtung: Datenhoheit, DSG, EVO-Konformität und so weiter auf, aber grundsätzlich ist das auch eine Technologie, die sich sehr sehr stark weiterentwickelt, die noch bei weitem nicht perfekt ist, aber die auch schon extrem helfen kann, aber das gibt natürlich auch, Oder führt uns zum nächsten Thema, Datenschutz und Sicherheit. Da gibt es natürlich sehr, sehr viele Sorgen von Unternehmen. Wir haben ja gerade eben die DSGVO-Konformität angesprochen. Voicebots müssen ganz klar europäische Datenschutzstandards erfüllen und da gibt es natürlich heute bei vielen Systemen ganz viele Fragezeichen Es gibt auch viele Systeme die sind gar nicht in Europa gehostet sondern in den USA. Es gibt Systeme die sind in Europa gehostet aber wie ist das denn, wenn ich den in Deutschland verwenden möchte und so weiter. Und da gibt es Herausforderungen. Das wird sich auch alles klären. Da wird es auch nochmal strengere Regelungen geben. Es gibt ja auch den EU-Eye Act und so weiter wo schon ein bisschen was definiert ist.
Das wird sich alles noch finden, aber die Sorge bei den Unternehmen ist generell heute da. Also viele Unternehmen setzen auf: selbst gehostete Lösungen. Ich vergleiche das immer so ein bisschen mit dem Bereich Telefonie, in dem ich mich sehr gut auskenne. Früher haben sehr, sehr viele Unternehmen eine On-Premise-Anlage gewollt und gesagt, also die Anlage die muss bei mir sein, weil die Telefonie ist so wichtig und kritisch das kann ich ja nicht in die Cloud auslagern. Und ich glaube hier haben wir so ein ähnliches Thema, dass viele Unternehmen jetzt sagen, ich möchte das gerne in-house machen. Was ich komplett nachvollziehen kann, aber ich glaube, hier kann man auch sehr, sehr gut auf Cloud-Lösungen umsteigen und das Ganze über die Cloud machen lassen, weil die Telefonanlagen sind fast eher in der Cloud gehostet und es gibt auch viele Anbieter, die das auch dann zusammenführen, also die Cloud-Telefonie mit eben diesen KI-Voicebots.
Aber grundsätzlich kann man sowas natürlich auch selber hosten wenn ich zum Beispiel an die Lösung von Playstyle denke, da kann man auch sein Large-Language-Model selber hosten egal wo, entweder bei sich im Unternehmen oder bei sich in Azure oder woanders und das dann eben mit dem Cloud-Voicebot verbinden und dann eben so die Kommunikation übernehmen und so habe ich quasi alles, was im Large-Language-Model dann verarbeitet wird,: eben bei mir und unter voller Kontrolle und Transparenz Kunden sollten natürlich wissen, dass sie mit einem Bot sprechen und da kommen natürlich ganz viele Fragen auf, vor allem wenn jetzt zum Beispiel eine Sentiment-Analyse gemacht wird, die Stimmung soll erkannt werden von einem Anrufer, möchte der Anrufer das, darf man das überhaupt, das sind alles noch so Fragen, die sind noch nicht so hundertprozentig beantwortet und damit muss man sich dann auch einfach befassen Was man auch nicht vergessen darf, ist, da so ein bisschen Change Management zu betreiben, denn der menschliche Faktor ist nach wie vor entscheidend und es muss Mitarbeiterakzeptanz auch für so eine Lösung da sein. Teams müssen in die Voicebot-Strategie eingebunden werden. Interne Kollegen, die zum Beispiel im Service arbeiten, wo der First Level so ein bisschen mit KI-Voicebots bespielt wird, die müssen das auch akzeptieren Die müssen eingebunden werden und die müssen auch mithelfen Das ist ganz, ganz wichtig. Das darf man wirklich nicht vergessen.
Bitte nicht einfach einführen und die Mitarbeiter vor vollendete Tatsachen stellen, sondern die Mitarbeiter wirklich mit ins: Boot holen mit die Strategie entwickeln lassen und dabei helfen lassen, den VoiceBot sauber einzuführen Dann funktioniert das auch. Viel viel besser. Ganz wichtig ist auch, dass die Kundenerwartungen klar definiert werden. Also wenn ich jetzt zum Beispiel an Playstyle denke, wenn wir mit einem Kunden sprechen, dann müssen wir den Kunden auch klar darüber aufklären, welche Möglichkeiten es gibt. Natürlich, wir wollen ja verkaufen, aber wir müssen auch die Grenzen der Technologie aufzeigen weil viele Kunden denken, dass sie jetzt ihre komplette Hotline automatisieren können. Das ist natürlich nicht immer der Fall. Also es gibt viele Dinge, die kann man automatisieren heute schon. Es wird auch in der Zukunft noch mehr Dinge geben, die man automatisiert über KI-Voicebots abbilden kann, aber man wird jetzt nicht kurzfristig die komplette Hotline dadurch ersetzen können und das muss man auch dem Kunden sagen.
Das muss der Kunde auf jeden Fall ganz klar wissen. Und kontinuierliche Optimierung, natürlich Voicebots benötigen regelmäßige Anpassung und Verbesserung, also jeder, der mal ein Voicebot eingerichtet hat, da muss man ganz viel Prompt Engineering betreiben und da ist man: ständig am Nachbessern und Verbessern und Justieren und wenn der Bot mal da irgendwie was blödes gesagt hat, dann muss man da wieder nachjustieren, dass er sowas nicht mehr sagt und solche Sachen sind ganz, ganz wichtig, dass man das kontinuierlich optimiert. Lösungen werden sich standardmäßig auch verbessern, Anbieter werden natürlich dafür sorgen, dass Immer besser wird, aber grundsätzlich ist es heute so, dass es da keinen richtigen Standard gibt, vor allem wenn wir jetzt ein Beispiel Wasserzählerstand Erfassung, da werden wir Systeme mit vernetzen müssen und da brauchen wir auch jemanden der muss das programmieren, da brauchen wir jemanden der muss gute Prompts bauen können, alleine damit das funktioniert und das muss man auch kontinuierlich optimieren, das ist keine Sache, die man heute out of the box machen kann, ganz ganz wichtig.
Was sind die Best Practices für die erfolgreiche Voicebot-Implementierung? Das ist quasi ein agiler Voicebot-Ansatz. Erfolgreiche Unternehmen setzen nämlich auf kontinuierliche Verbesserung. Bedeutet, wir müssen: analysieren. Regelmäßige Auswertung von Gesprächsverläufen müssen wir machen. Wir müssen anpassen. Schnelle Reaktion auf erkannte Schwächen. Wir müssen messen Klare KPIs für Erfolg definieren. Das muss man wirklich machen. Das vergessen viele, das vernachlässigen auch viele. Was möchte ich eigentlich erreichen? Und ab welchem Punkt wurden jetzt meine Erwartungen erfüllt oder übererfüllt? Das ist ganz wichtig, dass man hier auch wirklich klare Erfolgsfaktoren definiert Und wir müssen bei der Implementierung natürlich auch agil bleiben. Wir können jetzt nicht ein 6-Monats-Projekt daraus machen, sowas zu implementieren und sagen, nach 6 Monaten ist das jetzt fertig, das wird kontinuierlich weiterentwickelt und das muss am Ende eine agile Umsetzung von Verbesserungen sein bzw. beinhalten Dinge, die sich bei einem Voicebot bewährt haben, also Erfolgsfaktoren sozusagen, ist einmal die Mehrsprachigkeit.
Eben schon erwähnt die Unterstützung von verschiedenen Sprachen und Dialekten ist super wichtig und natürlich auch super essentiell für zum Beispiel ein Service Center, wenn ich meinen: Service auf einmal nicht nur in zwei, drei Sprachen anbieten kann, sondern vielleicht sogar in 20 Sprachen Und ich brauche auch gar nicht mehr... So viele Mitarbeiter die diese Sprachen sprechen, damit ich diesen Service aufrechterhalten kann und das ist ein klarer Erfolgsfaktor, dass wir jetzt ein mehrsprachiges Service-Hotline haben oder vielleicht ein mehrsprachiges. Annahme von Telefonaten, Rezeption oder bei einem Arzt die Rezeptaufnahme etc. Da gibt es ja verschiedene Beispiele. CRM-Integration, Zugriff auf Kundendaten für persönliche Gespräche, auch ganz wichtig, dass wir wirklich erkennen können, wer ruft da an, dass wir dann auch Kontext haben, dass wir vielleicht merken der Kunde hat eine offene Rechnung oder er hat hier noch zwei unbeantwortete Tickets, dass die KI wirklich darauf eingehen kann und Daten in Echtzeit abrufen kann, auch ganz, ganz wichtig.
Und natürlich der hybride Ansatz, dürfen wir nicht vernachlässigen Es muss immer noch eine intelligente Weiterleitung an menschliche Agenten geben, wenn der Bedarf besteht, wenn der Intent nicht erkannt werden kann. Wenn man mit der KI nicht weiterkommt, dann muss das System automatisch an Agenten: weiterleiten können. Und natürlich Continuous Learning Systeme also KI-Voiceboard-Systeme die müssen aus jeder Interaktion lernen und besser werden. Ganz, ganz wichtig oder ein ganz, ganz wichtiger Faktor Doch wohin entwickeln sich die Voicebots? Also da gibt es viele Dinge, die die nächste Generation von Voicebots noch intelligenter machen werden. Dazu gehört zum Beispiel die emotionale Intelligenz dass wir... Echte Empathie-Modellierung basierend auf der Stimmanalyse haben und das wir auch als IT-Bot oder KI-Bot mit einer emotionalen Empathie-Stimme sozusagen antworten können. Also wir können wirklich dann darauf reagieren, dass jemand sauer ist und dann können wir wirklich empathisch reagieren.
Ambient Intelligence, hochkomplexes Thema, proaktive Unterstützung, bevor die Probleme überhaupt entstehen, multimodale Interaktion, Kombination von Sprache Text und visuellen Elementen das ist natürlich beim Telefonat jetzt nicht komplett möglich, das muss man schon mit mehreren Systemen: machen, aber da gibt es ja auch Möglichkeiten, dass man zum Beispiel, wenn man auf einer Webseite ist, Nehme ich jetzt mal Webex als Beispiel, dass man sich quasi eine Möglichkeit bauen kann, wenn man auf die Telefonnummer klickt, dass man dann in einer Warteschlange landet oder vielleicht in einem Call landet, wo man auch Videotext hat, wo man telefonieren kann, ohne dass man sich etwas installieren muss, dass das wirklich alles über die Webseite läuft. Und da kann man natürlich prima Sprachetexte und visuelle Elemente mit einbauen. Ich bin auch davon überzeugt dass wir ganz viele sprach- und branchenspezifische Spezialisierungen haben werden. Bots haben. Anbieter werden dafür sorgen, dass wir Bots für verschiedene Anwendungsfälle haben werden. Für zum Beispiel medizinische Assistenten spezialisiert auf Gesundheitsfragen und Terminmanagement.
Finanzbots die vielleicht ein Expertenrat für Bankdienstleistungen und Investitionen bieten können. Und technische Supportbots, die tiefes Produktwissen oder die mit tiefem Produktwissen gefüttert werden können, um komplexe Problemlösungen herbeizuführen. Und es gibt natürlich auch noch ein paar technologische Durchbrüche, die die Voicebots: revolutionieren können. Einmal Edge-Computing dass lokal Daten verarbeitet werden, damit wir eine noch bessere Latenz haben und noch besseren Datenschutz. 5G-Integration kann auch dafür sorgen, dass wir eine höhere Qualität haben. Bessere Latenz und neue Anwendungsmöglichkeiten und Quantum Computing, dass wir exponentiell verbesserte Sprachverarbeitung haben. Das jetzt mal als ein paar Buzzwords, die ich jetzt nicht näher erläutere, aber die natürlich auch nochmal in der Zukunft dafür sorgen können, dass sich alles nochmal ein bisschen mehr revolutioniert und alles nochmal besser und schneller wird. Fassen wir das Ganze mal zusammen. KI-Voicebots sind mehr als nur ein technologischer Trend, denn sie sind aus meiner Sicht ganz klar die Zukunft der Telefonie Es wird später keinen Kunden mehr geben, der das nicht brauchen wird.
Also jeder, der irgendwie eine Hotline hat, wo man anruft der wird KI da verwenden und da werden einfache Fragen beantwortet werden und es gibt smarte Weiterleitungen. Die Kombination aus natürlicher Sprachverarbeitung Künstlicher Intelligenz und bewährter Telefonieinfrastruktur wird völlig neue Möglichkeiten für Unternehmen und: Kunden schaffen und schafft das auch heute schon. Kriege ich mit bei Playstail, dass wir da ganz viele Anfragen haben, die genau das möchten und die diese Möglichkeiten ausschöpfen möchten. Und ich glaube, das wird, wie gesagt, später auch jeder benutzen oder benutzen müssen, einfach um vielleicht auch konkurrenzfähig zu bleiben. Die Technologie ist nämlich heute auf jeden Fall ausgereift genug für den produktiven Einsatz. Noch nicht perfekt. Kann auch noch nicht alles, aber ausgereift genug, um produktiv eingesetzt zu werden. Und die Erfolgsgeschichten das muss man einfach nochmal googeln sprechen auf jeden Fall für sich Unternehmen die jetzt auf Voicebots setzen, verschaffen sich einen entscheidenden Wettbewerbsvorteil. Davon bin ich auch überzeugt Ich habe ja eben schon ein paar Beispiele genannt, alleine wenn man den Personalbedarf reduziert, wenn wir die Kosten reduzieren. Voicebots sind mitunter nicht unbedingt günstig aber es ist, wenn man das vergleicht dass ein Mitarbeiter viel sinnvollere Tätigkeiten machen kann, ist das schon Gold wert.
Mein Tipp ist hier, startet mit einem klar definierten: Anwendungsfall, sammelt Erfahrung und baut kontinuierlich aus. Die Voiceboard-Revolution hat ja gerade erst begonnen, da wird noch ganz, ganz ganz viel kommen, aber ich glaube, das ist eine spannende Technologie mit der man sich heute schon beschäftigen muss und wie das immer so ist, wenn man einer der Ersten ist, dann hat man natürlich jetzt den Wettbewerbsvorteil, wenn wir das in drei Jahren machen, dann wird das wahrscheinlich eh schon fast jeder haben. Habt ihr schon Erfahrungen mit Voicebots gemacht? Als Unternehmen oder als Kunde? Schreibt mir gerne eure Gedanken und Fragen. In der nächsten Folge erkunden wir einen weiteren spannenden Tech-Trend oder reden vielleicht auch noch über Use-Cases zu KI-Voicebots. Bis dahin bleibt innovativ und redet weiter. Euer Daniel. Macht es gut. Ciao, ciao.