Please activate JavaScript!
Please install Adobe Flash Player, click here for download

Nova Acta Leopoldina Band 110 Nummer 377

Zusammenfassung Die Computersimulation des menschlichen Sprachverhaltens ist eines der ehrgeizigsten wissenschaftlichen ziele un- seres zeitalters. Sie setzt die multidisziplinäre zusammenarbeit von Informatikern, Linguisten und Sprachpsychologen sowie Spezialisten der Computerlinguistik und der Künstlichen Intelligenz voraus. In den letzten 30 Jahren ist es uns gelungen, die komplexen Prozesse des Sprachverstehens, der Sprachproduktion und des menschlichen Dialogver- haltens immer exakter zu simulieren, so dass man zum Dialog mit Computersystemen verstärkt die natürliche Sprach- eingabe anstatt umständlich Tastatur und Maus verwenden kann. Die wissenschaftlichen Durchbrüche haben zu einer Sprachtechnologie geführt, mit der heute robuste Sprachdialogsysteme für maschinelle Auskunfts-, Buchungs-, Be- stell- und Beratungssysteme realisiert werden können – allerdings stets eingeschränkt auf einen bestimmten Diskurs- bereich. Durch die Einbettung von Sprachtechnologie in Alltagsgegenstände wird es möglich, beispielsweise Fahrerassistenzsysteme im Auto sprachlich zu steuern oder entsprechend instrumentierte Weinflaschen im Verkaufs- regal anzusprechen. Damit wird der uralte Menschheitstraum, mit den Dingen sprechen zu können, in greifbare Nähe gerückt. zunächst wird motiviert, warum Sprachverstehen durch Computer so extrem schwierig ist: Wie kann Sprach- verhalten algorithmisch beschrieben werden? Welche kognitiven Leistungen müssen simuliert werden, um natürliches Sprachverhalten zu reproduzieren? Der Beitrag erläutert die komplexen Verarbeitungsprozesse in aktuellen Sprach- dialogsystemen und macht die derzeitigen Grenzen bei der Simulation von Sprachverhalten deutlich. Es wird gezeigt, wie Mehrdeutigkeiten der Sprache im Dialogkontext aufgelöst werden können und wie Sprache mit Gestik und Mimik in multimodalen Dialogen integriert werden kann. Es wird die Entwicklung der Forschung zur Sprachtechnologie in Deutschland in vier Dekaden bis hin zur kommerziellen Nutzung aufgezeigt. Schließlich wird auch gezeigt, wo der weitere massive Forschungsbedarf liegt, um Computer zu echten Dialogpartnern machen zu können. Abstract The computer simulation of human language behavior is one of the most ambitious scientific goals of this century. It requires multidisciplinary collaboration of computer scientists, linguists and psycholinguists as well as specialists in computational linguistics and artificial intelligence. During the last 30 years, our simulations of the complex processes underlying language understanding, language production and human dialog behavior became more and more precise, so that today we can increasingly use speech input instead of the cumbersome keyboard and mouse for the interaction with computer systems. Scientific breakthroughs have lead to quite mature language technology that enables us to realize spoken dialog systems for automated help, booking, ordering and consulting systems – however always re- stricted to a limited discourse domain. Embedding language technology into everyday items allows us, for example, to control driving assistance systems in cars by speech or to talk to wine bottles in instrumented shopping shelves. Thus the ancient dream of mankind, to be able to converse with things, is coming into reach. First, we motivate why language understanding is so extremely difficult for computer systems: How can we describe language behavior com- putationally? Which cognitive abilities must be simulated to reproduce natural language behavior? This paper dis- cusses the complex processing schemes of current spoken dialog systems and presents today’s limits of these simulations. We show how ambiguity can be resolved in the dialog context and how we can combine speech with gestures and facial expressions in multimodal dialogs. We present the development of human language technology in Germany during four decades up to the commercial deployment. Finally, we discuss the massive need for further research, if we want to use computers as real dialog partners. Nova Acta Leopoldina NF 110, Nr. 377, 119–141 (2011) Wolfgang Wahlster 120