Hesitations in Spoken Dialogue Systems

Hesitations in Spoken Dialogue Systems

Dokumentinformationen

Autor

Simon Betz

instructor Prof. Dr. Petra Wagner
Schule

Bielefeld University

Veröffentlichungsjahr 2020
Ort Bielefeld
Dokumenttyp PhD thesis
Sprache English
Seitenanzahl 154
Format
Größe 1.32 MB
  • Spoken Dialogue Systems
  • Disfluency Synthesis
  • Speech Production

Zusammenfassung

I. Einleitung

Die Einleitung des Dokuments bietet einen Überblick über die Hesitation in Spoken Dialogue Systems. Es wird erläutert, wie Hesitation als ein wichtiges Element in der menschlichen Kommunikation fungiert. Die Relevanz von Hesitation wird durch die Notwendigkeit unterstrichen, diese Phänomene in der Sprachsynthese zu berücksichtigen. Die Einleitung stellt die Forschungsfrage und die Ziele der Arbeit vor, die darauf abzielen, die Mechanismen und Funktionen von Hesitation zu verstehen. Ein zentrales Anliegen ist es, die Auswirkungen von Hesitation auf die Interaktion zwischen Mensch und Maschine zu analysieren. Die Einleitung schließt mit einem Ausblick auf die Struktur der Arbeit und die behandelten Themen.

II. Form Funktion und Modellierung von Disfluencies

In diesem Abschnitt wird die Form und Funktion von Disfluencies untersucht. Disfluencies sind Unterbrechungen in der Sprache, die oft durch Hesitation verursacht werden. Der Abschnitt beschreibt verschiedene Typen von Disfluencies, einschließlich Filler und Silence. Es wird erklärt, wie diese Elemente in der Sprachproduktion auftreten und welche Rolle sie in der Kommunikation spielen. Die Modellierung von Disfluencies wird durch verschiedene theoretische Ansätze unterstützt, darunter Levelt’s Blueprint und Shriberg’s Disfluency Model. Diese Modelle helfen, die Komplexität der Sprachproduktion zu verstehen und die Mechanismen hinter Hesitation zu entschlüsseln.

2.1 Einführung in die Phänomene

Die Einführung in die Phänomene von Disfluencies legt den Grundstein für das Verständnis der verschiedenen Arten von Hesitation. Es wird erläutert, dass Hesitation nicht nur ein Zeichen von Unsicherheit ist, sondern auch als strategisches Werkzeug in der Kommunikation eingesetzt werden kann. Die Analyse der Hesitation zeigt, dass sie oft dazu dient, dem Sprecher Zeit zu geben, um nachzudenken oder um die Aufmerksamkeit des Zuhörers zu steuern.

2.2 Modelle der Sprachproduktion

Die Modelle der Sprachproduktion bieten einen theoretischen Rahmen, um die Mechanismen hinter Hesitation zu verstehen. Levelt’s Blueprint beschreibt den Prozess der Sprachproduktion als inkrementell und unterstreicht die Bedeutung von Buffering. Diese Konzepte sind entscheidend, um zu verstehen, wie Hesitation in der natürlichen Sprache auftritt und welche kognitiven Prozesse dabei eine Rolle spielen.

III. Empirische Untersuchungen

Die empirischen Untersuchungen konzentrieren sich auf die Analyse von Hesitation in der gesprochenen Sprache. Verschiedene Studien wurden durchgeführt, um die Häufigkeit und Verteilung von Disfluencies zu erfassen. Die Ergebnisse zeigen, dass Hesitation in verschiedenen Kontexten unterschiedlich auftritt und dass die Dauer und Art der Hesitation signifikante Auswirkungen auf die Wahrnehmung der Sprecher haben. Diese Erkenntnisse sind für die Entwicklung von Spoken Dialogue Systems von großer Bedeutung, da sie helfen, die Interaktion zwischen Mensch und Maschine zu verbessern.

3.1 Corpus Studie 1 Menschliche Disfluencies

Die erste Corpus-Studie untersucht menschliche Disfluencies und deren Merkmale. Die Analyse zeigt, dass Hesitation häufig in alltäglichen Gesprächen vorkommt und dass die Sprecher verschiedene Strategien verwenden, um diese zu managen. Die Ergebnisse dieser Studie sind entscheidend für die Entwicklung von Modellen, die Hesitation in der Sprachsynthese berücksichtigen.

3.2 Experimentelle Studie 1 Modulare Disfluency Synthese

In der experimentellen Studie wird eine modulare Synthese von Disfluencies untersucht. Die Ergebnisse zeigen, dass die Integration von Hesitation in die Sprachsynthese die Natürlichkeit und Verständlichkeit der erzeugten Sprache erheblich verbessert. Diese Erkenntnisse sind für die praktische Anwendung in Spoken Dialogue Systems von großer Bedeutung.

IV. Implementierung und Evaluation

Der Abschnitt zur Implementierung und Evaluation behandelt die praktischen Anwendungen der Forschungsergebnisse. Es wird erläutert, wie die Erkenntnisse über Hesitation in die Entwicklung von Spoken Dialogue Systems integriert werden können. Die Evaluation der implementierten Systeme zeigt, dass die Berücksichtigung von Hesitation die Benutzererfahrung verbessert und die Interaktion natürlicher gestaltet. Die Ergebnisse dieser Evaluierung sind entscheidend für die zukünftige Forschung und Entwicklung in diesem Bereich.

4.1 Strategie zur Hesitationsintegration

Die Strategie zur Integration von Hesitation in Spoken Dialogue Systems wird detailliert beschrieben. Es wird erläutert, wie verschiedene Arten von Hesitation identifiziert und in die Sprachsynthese implementiert werden können. Diese Strategie zielt darauf ab, die Interaktion zwischen Mensch und Maschine zu optimieren und die Akzeptanz von Spoken Dialogue Systems zu erhöhen.

Dokumentreferenz

  • Hesitations in Spoken Dialogue Systems (Simon Betz)
  • Levelt’s Blueprint for the Speaker (Levelt)
  • Shriberg’s Disfluency Model (Shriberg)
  • Disfluencies as a Conversational Tool (Unbekannt)
  • Synthesis Evaluation (Unbekannt)