slider

Lokaler Befehlsempfänger - Prof. Dr. Norbert Pohlmann

Lokaler Befehlsempfänger

Lokaler Befehlsempfänger - Compliance-gerechten Sprachassistenten

T. Hüsch, N. Pohlmann:
„Lokaler Befehlsempfänger – Was einen Compliance-gerechten Sprachassistenten von „Alexa“ unterscheidet“,
IT-Sicherheit – Mittelstandsmagazin für Informationssicherheit und Datenschutz, DATAKONTEXT-Fachverlag, 2/2022

Motivation für einen dezentralen Sprachassistenten – lokaler Befehlsempfänger

Sprachassistenten sind IT-Systeme, die mithilfe der natürlichen Sprachen Dienste für den Nutzer erbringen. Diese haben in den letzten Jahren immer mehr an Bedeutung gewonnen und kommen in vielen Anwendungsbereichen auf verschiedenen Endgeräten zum Einsatz. Im Allgemeinen besteht ein Sprachassistent aus verschiedenen Softwarekomponenten, wodurch die Ausführung von Sprachbefehlen ermöglicht wird. Beispielsweise können im Smart Home Bereich intelligente Geräte verbunden und durch Sprachbefehle gesteuert werden, im Arbeitsumfeld wird durch sprachbasierte Interaktion eine höhere Effizienz ermöglicht, z.B. wenn Bedienelemente durch die Hände nicht betätigt werden können. Menschen mit körperlichen Einschränkungen profitieren durch die sprachbasierte Interaktion von einer Erleichterung des Alltags. Neben diesen Chancen bringen Sprachassistenten aber auch Risiken mit sich, wie Sicherheitslücken, die zum Öffnen der Wohnungstüre ausgenutzt werden können [1].

Zurzeit ist Alexa in Deutschland der meist genutzte Sprachassistent. Dabei handelt es sich um eine cloudbasierte Architektur von Amazon, mit welcher vor allem Datenschutzproblematiken verbunden sind. Cloudbasierten Sprachassistenten senden die Sprachdaten des Nutzers zur Spracherkennung in die Cloud, was im Zusammenhang mit Privatsphäre und der Datenhoheit des Nutzers problematisch ist [2]. Auch die Abhängigkeit zu Cloud-Anbietern kann zu Schwierigkeiten führen, z.B. wenn sich die Sprachassistenten oder Smart Home Geräte nicht mehr verwenden lassen, weil der Anbieter seinen Dienst einstellt.

Ziel und Anforderungen

Im Rahmen eines internen Forschungsprojektes im Institut für Internet-Sicherheit wurde ein dezentraler Sprachassistent entwickelt, der die beschriebenen Probleme im Zusammenhang mit der cloudbasierten Architektur löst, im Offline-Betrieb operieren kann und die Sprachdaten auf dem Gerät lokal verarbeitet, ohne sie in eine entfernte Cloud übertragen zu müssen.

Ziel des Projekts war die Entwicklung einer datenschutzfreundlichen Alternative zu cloudbasierten Sprachassistenten im Smart Home Umfeld, der die folgenden Anforderungen erfüllt:

  • Hohe Privatsphäre und Datenhoheit des Nutzers
  • Hohe Qualität der Spracherkennung auch ohne cloudbasierte Verarbeitung der Sprachdaten
  • Einwandfreie Funktionalität auch ohne Verbindung zum Internet 

Die nachfolgenden Kapitel zeigen, wie diese Anforderung bei der Entwicklung des dezentralen Sprachassistenten umgesetzt wurden.

Architektur des Sprachassistenten

Der Sprachassistent wurde mit dem Rhasspy Framework entwickelt – ein Rahmensystem das Schnittstellen für alle notwendigen Softwarekomponenten eines Sprachassistenten zur Verfügung stellt. Dadurch wird eine einfache und schnelle Implementierung ermöglicht, ohne tiefes Grundwissen über die mathematischen Modelle von Spracherkennungsalgorithmen besitzen zu müssen.

Die Komponenten lassen sich mit Rhasspy über “Profile“ konfigurieren. Ein Profil setzt sich aus den einzelnen Konfigurationen der Komponenten des Sprachassistenten zusammen. Die Komponenten spiegeln gleichzeitig den Workflow des Sprachassistenten wider (siehe Abbildung 1)

  1. Audioaufnahme: Aufnahme des Gesprochenen mit dem Linux-basierten Audioaufnahme-Tool “arecord“ über ein Mikrofon und Speicherung in einer WAV-Datei
  2. Wake Word Erkennung: Erkennung des Rufwort oder auch “Wake-Word“ – z.B. „Alexa“ oder „Hi Siri“ anhand der WAV-Datei
  3. Spracherkennung bzw. Umwandlung von Sprache in Text: Erzeugung einer textbasierten Darstellung der WAV-Datei mit dem Open Source Spracherkennungs-Toolkit “Kaldi“
  4. Befehlserkennung: Erkennung des Befehls aus der textbasierten Darstellung mit “Rasa NLU“, ein auf Machine Learning basiertes Toolkit für “Natural Language Understanding“ (NLU)
  5. Umsetzung der Befehle: Umsetzung der Befehle mit entsprechenden angebundenen Softwarekomponenten, z.B. “Home Assistant“ für die Smart Home Funktionalitäten
  6. Umwandlung von Text in Sprache: Insofern eine Antwort des Sprachassistenten erforderlich ist, wird der erzeugte Text, z.B. von „Home Assistant“ zurück an das Rhasspy Framework übermittelt, in Sprache umgewandelt und
  7. in der Audioausgabe über die verbundenen Lautsprecher ausgegeben

Alle Softwarekomponenten und Optionen des Rhasspy Frameworks sind austauschbar. Es kann z.B. pro Nutzer ein Profil eingerichtet werden, sodass eine Instanz mit der Spracherkennung basierend auf “Kaldi“ in deutscher Sprache parallel zu einer Instanz basierend auf “DeepSpeech“ in englischer Sprache laufen kann. So ist auch eine separate Weiterentwicklung der Sprachmodelle durch einzelne Nutzer möglich.



kostenlos downloaden



Weitere Informationen zum Begriff “Lokaler Befehlsempfänger”

Artikel:
Risiko von unsicheren Internet-Technologien

Wertschöpfung der Digitalisierung sichern – Vier Cybersicherheitsstrategien für den erfolgreichen Wandel in der IT“

IT-Sicherheit im Lauf der Zeit

Das Manifest zur IT-Sicherheit – Erklärung von Zielen und Absichten zur Erreichung einer angemessenen Risikolage in der IT“

Strafverfolgung darf die IT-Sicherheit im Internet nicht schwächen

Wie wirtschaftlich sind IT-Sicherheitsmaßnahmen

Risikobasierte und adaptive Authentifizierung

Eine vertrauenswürdige Zusammenarbeit mit Hilfe der Blockchain-Technologie

Künstliche Intelligenz und Cybersicherheit – Unausgegoren aber notwendig“

Vertrauen – ein elementarer Aspekt der digitalen Zukunft

Eine Diskussion über Trusted Computing – Sicherheitsgewinn durch vertrauenswürdige IT-Systeme“

Ideales Internet-Frühwarnsystem

Bedrohungen und Herausforderungen des E-Mail-Dienstes – Die Sicherheitsrisiken des E-Mail-Dienstes im Internet“

Vorlesungen: „Vorlesungen zum Lehrbuch Cyber-Sicherheit

Bücher:

Lehrbuch Cyber-Sicherheit – Das Lehrbuch für Konzepte, Mechanismen, Architekturen und Eigenschaften von Cyber-Sicherheitssystemen in der Digitalisierung

Bücher im Bereich Cyber-Sicherheit und IT-Sicherheit zum kostenlosen Download

  • Sicher im Internet: Tipps und Tricks für das digitale Leben
  • Der IT-Sicherheitsleitfaden
  • Firewall-Systeme – Sicherheit für Internet und Intranet, E-Mail-Security, Virtual Private Network, Intrusion-Detection-System, Personal Firewalls

Forschungsinstitut für Internet-Sicherheit (IT-Sicherheit, Cyber-Sicherheit)
Master-Studiengang Internet-Sicherheit (IT-Sicherheit, Cyber-Sicherheit)

Marktplatz IT-Sicherheit





Summary
Lokaler Befehlsempfänger
Article Name
Lokaler Befehlsempfänger
Description
Lokaler Befehlsempfänger sind IT-Systeme, die mithilfe der natürlichen Sprachen Dienste für den Nutzer erbringen. Ziel des Projekts war die Entwicklung einer datenschutzfreundlichen Alternative zu cloudbasierten Sprachassistenten im Smart Home Umfeld.
Author
Publisher Name
Institut für Internet-Sicherheit – if(is)
Publisher Logo
Lokaler Befehlsempfänger - Compliance-gerechten Sprachassistenten
Lokaler Befehlsempfänger Prof. Dr. Norbert Pohlmann - Cyber-Sicherheitsexperten