20.10.2020 (as)
4 von 5, (2 Bewertungen)

Diktierworkflow-Lösung mit cloudbasierter Spracherkennung

  • Inhalt dieses Artikels
  • Spracherkennung aus der Cloud
  • Textdateien per Workflow automatisiert verarbeiten

Sprache erkennen und per Workflow weiterverarbeiten (Bild: SPS)Sprache erkennen und per Workflow weiterverarbeiten (Bild: SPS)Das Unternehmen Speech Processing Solutions (SPS) ist ein internationales Technologieunternehmen, das Speech-to-Text-Lösungen entwickelt und verkauft. Diese Lösungen umfassen sowohl Workflow-Software als auch professionelle Diktiergeräte, die unter der Marke »Philips« geführt werden.

Zusätzlich zur Workflow-Funktion bietet nun die Diktierworkflow-Lösung für Unternehmen »SpeechExec Enterprise 7.0 (SEE 7.0)« von SPS die cloudbasierte Spracherkennungslösung  »Dragon« von Nuance Communications. Damit können Anwender sowohl Audio- als auch Textdateien bearbeiten und archivieren. Verfügbar sind die Sprachen Englisch, Deutsch, Französisch, Niederländisch, Schwedisch und Spanisch.

Spracherkennung aus der Cloud

Bei der Frontend-Spracherkennung stellt Speechexec Enterprise eine Verbindung zum dedizierten Windows-Server her – entweder vor Ort oder in der Cloud. Autoren haben so die Möglichkeit, die neueste Spracherkennungs-Engine mit integierter Deep-Learning-Technologie von Nuance für ihren digitalen Diktier-Workflow zu nutzen. In der Backend-Variante werden Dateien von der »Philips Voice Recorder App« für Smartphones und mobilen Diktiergeräten (»Philips SpeechAir«, »Philips PocketMemo«) an einen freigegebenen Netzwerkordner gesendet. Der Philips Speech Recognition Server überwacht diesen Ordner, holt sich neue Dateien automatisch ab und wandelt sie in Text um.

Textdateien per Workflow automatisiert verarbeiten

In der Praxis können Unternehmen mit der Lösung verschiedene Anwendungsszenarien abdecken: Für E-Mails, Memos und andere Kurztexte genügt die reine Spracherkennung mit den cloudbasierten Spracherkennungslösungen »Dragon Legal Anywhere« beziehungsweise »Dragon Professional Anywhere«. Längere Texte und umfangreiche Schriftsätze, bei denen mehrere Personen involviert sind, werden durch Kombination von Spracherkennung und Diktatworkflow erledigt. Von mobilen Diktiergeräten und Smartphones aus können Texte automatisch an die Spracherkennung und zur Finalisierung  an die richtige Zielperson weitergeleitet werden, was für kürzere Durchlaufzeiten sorgt. Echtzeitinformationen zum Auftragsstatus ermöglichen eine einfache Verfolgung der Arbeit. Eine Prioritätseinstellung hilft, Aufnahmen als besonders dringlich zu kennzeichnen.

Benutzer, Lizenzen und Systemeinstellungen lassen sich per Fernadministration verwalten. Durch die zentrale Administration können Arbeitslistenspalten, Filter und Jobinformationen konfiguriert werden. Aufgrund des Concurrent-Licensing-Modells sind nur für die Lizenzen zu bezahlen, die tatsächlich benötigt werden.