
Echtzeitgesprächen mit LiveKit und einem mehrstufigen Orchestrierungsmodell für KI-Agenten
LiveKit ist eine WebRTC-basierte SFU (Selective Forwarding Unit) und bildet die Grundlage für unsere Echtzeitkommunikation. Die SFU leitet Audio/Video-Streams effizient weiter, ohne sie für jeden Teilnehmer neu zu encodieren. Das sorgt für geringe Latenz, gute Qualität und stabile Verbindungen – auch wenn Lastspitzen auftreten, etwa bei Massenschäden. Adaptive Bitrate, Netzwerkanpassungen und horizontale Skalierung helfen, Gesprächsqualität und Verfügbarkeit hochzuhalten. In Kombination mit Claim Storm können so auch sehr viele Schadenfälle in kurzer Zeit parallel abgewickelt werden.
Vor jedem KI-Schritt steht eine robuste Signalkette: Echo-Unterdrückung, Voice Activity Detection (VAD) und Rauschreduktion schaffen klare Spracheingaben. Anschließend wird in Echtzeit transkribiert. Die erkannten Texte gehen an die NLU (Natural Language Understanding), die Anliegen, Intentionen und relevante Entitäten wie Schadentyp, Zeitpunkt oder Ort herausarbeitet. Auf dieser Basis generiert das System passende Antworten und Checkfragen. Die Ausgabe erfolgt per Streaming-Sprachsynthese, damit das Gespräch natürlich und flüssig bleibt. Nutzerinnen und Nutzer können jederzeit „dazwischen sprechen“; VAD und Barge-in-Handling sorgen dafür, dass die KI sofort aufhört zu sprechen und zuhört.
Über der reinen Sprachtechnik liegt der Agent Orchestrator. Er führt das Gespräch zunächst allgemein, um die Schadensursache zuverlässig einzugrenzen. Sobald klar ist, worum es geht, leitet er an spezialisierte KI-Agenten weiter – etwa für Brandschäden, Leitungswasserschäden, Sturm-/Hagelschäden, Einbruch/Diebstahl, Kfz oder allgemeine Sachschäden. Jede Spezialisierung bringt eigene Fachlogik, Checklisten und Prüfregeln mit. Der Orchestrator übergibt Kontext und bereits erfasste Daten, damit nichts doppelt abgefragt wird. So wird das Gespräch zielgerichtet, schneller und fachlich präzise.
Der Wechsel zu einem Spezialagenten oder in einen anderen Modus richtet sich nach klaren Kriterien. Dazu gehören:
Wenn es die Situation erfordert, kann ein Versicherungsmitarbeiter oder eine Sachbearbeiterin das Gespräch in derselben Session übernehmen. Es ist kein Medien- oder Kanalwechsel nötig. Der Live-Agent sieht strukturierte Informationen aus dem bisherigen Verlauf: bereits erfasste Daten, To-dos, fachliche Checklisten, rote Flags und Compliance-Hinweise. So geht keine Zeit verloren, Rückfragen werden minimiert und die nächsten Schritte sind klar vorgegeben. Nach Bedarf kann der Live-Agent die KI im Hintergrund weiter nutzen, etwa für Zusammenfassungen oder Formulierungsvorschläge.
Auch bei Verbindungsproblemen bleibt das System handlungsfähig. Kurzzeitige Netzabbrüche werden erkannt; die Session stellt sich automatisch wieder her und setzt an der richtigen Stelle fort. Ist eine erneute Einwahl nötig, steht ein schneller Rejoin zur Verfügung. Optional ist ein PSTN-Fallback möglich: Das Gespräch kann – je nach Konfiguration – auf eine Telefonverbindung wechseln, wenn IP-Audio nicht verfügbar ist. Alle zuvor erfassten Daten bleiben erhalten, und der zuständige Agent (KI oder Mensch) sieht die Historie ohne Bruch. Diese Mechanismen sind besonders wichtig bei Massenevents, wenn Netze ausgelastet sind.
Sicherheit ist zentraler Bestandteil der Architektur. Audio- und Videodaten werden beim Transport verschlüsselt. Zugriffstokens sind zeitlich limitiert und besitzen fein granulare Scopes, um Rechte strikt zu trennen. Rollen- und Berechtigungskonzepte stellen sicher, dass nur autorisierte Personen oder Dienste auf Inhalte zugreifen. Jede relevante Aktion wird für Audit-Trails protokolliert. Speicherung, Verarbeitung und Aufbewahrung von Daten erfolgen gemäß unseren Datenschutz- und Compliance-Vorgaben, inkl. DSGVO-Grundsätzen. Aufzeichnungen und Transkripte werden – sofern aktiviert – geschützt abgelegt; sensible Inhalte können automatisiert geschwärzt oder minimiert werden. Wir setzen auf bewährte Sicherheitsstandards, regelmäßige Prüfungen und fortlaufende Weiterentwicklung.
Ein Gespräch startet meist mit einer kurzen Klärung: Wer spricht, was ist passiert, gibt es akute Gefahren? Die Pipeline transkribiert und versteht den Inhalt in Echtzeit, der Orchestrator stellt gezielte Fragen und erkennt den Schadentyp. Danach übernimmt der spezialisierte Agent mit einem strukturierten, aber dialogischen Ablauf. Bei Unklarheiten wird nachgefasst, bei roten Flags eskaliert das System an den Live-Support. Am Ende liegen geprüfte Angaben, wichtige Belege und klare nächste Schritte vor – inklusive Zusammenfassung für die Akte in Claim Expert.
Vorteile für alle Beteiligten
Claimspace ist eine Plattform, die von Versicherungen und Sachverständigen eingesetzt wird. Bestimmte Funktionen – etwa PSTN-Fallback oder Aufzeichnung – sind abhängig von der jeweiligen Einrichtung und den Vorgaben Ihres Unternehmens. Wenn Sie nicht sicher sind, welche Optionen für Ihr Team aktiviert sind, wenden Sie sich an Ihre Administratorin oder Ihren Ansprechpartner bei Claimspace.