News: ETH Life - die tägliche Web-Zeitung

www.ethlife.ethz.ch

Rubrik: News

Beat Pfister zum Forschungsstand sprachverarbeitender Computersysteme
Gespräche mit dem Computer

Published: 26.04.2005 06:00
Modified: 26.04.2005 17:20

(sb) Einblicke in die Spracherkennung und Sprachsynthese – wie Computer also zuhören und sprechen können – gewährte Projektleiter Beat Pfister vom Institut für Technische Informatik und Kommunikationsnetze am vergangenen Mittwochabend (1) . Im Rahmen der Showcase-Event-Reihe von ETH World skizzierte er Ansätze für die Weiterentwicklung sprachverarbeitender Systeme auf einer interdisziplinären Basis (2) .

Wenn wir zuhören, dann empfangen wir nicht bloss ein Sprachsignal. Aus der gesprochenen Sprache erkennen wir etwa einen Dialekt, das Geschlecht oder den gesundheitlichen Zustand. Zudem ist die gesprochene Sprache mit Emotionen unterlegt und durch die Raumakustik und weitere Störgeräusche verzerrt. Für die Forschung stellen diese begleitenden akustischen Merkmale ein Problem dar. Unklar ist, wo ein Laut im Sprachsignal mit welcher Länge vorkommt. Dieses Problem versuchte die Forschung mit Hilfe der Wahrscheinlichkeitstheorie auf der Grundlage lexikalischen Wissens zu lösen.

Trefferquote um 50 Prozent verbessert

Mit der gestiegenen Rechenleistung der Computer in den 80er und 90er Jahren erlebte die Spracherkennung der englischen Sprache eine veritable Blüte. Nicht so im deutschen Sprachraum. Die deutsche Sprache erwies sich aufgrund ihrer Komplexität solchen Ansätzen weniger zugänglich. Das Forschungsteam um Pfister entschied sich daher für einen interdisziplinären Ansatz, der auf das Wissen der Linguistik zurückgreift.

ETH World

ETH World ist ein strategisches Programm zum Aufbau eines virtuellen Raums zur Kommunikation und Kooperation unabhängig von Zeit und Ort. Dieser Raum soll für alle Anspruchsgruppen der ETH Zürich zugänglich sein und breit genutzt werden.

ETH World unterstützt alle ETH-Angehörigen in ihren Kernaufgaben – Lehren, Lernen, Forschen und den dazugehörenden Managementleistungen. Das Programm erschliesst zudem neue Möglichkeiten der Vernetzung und Zusammenarbeit mit Wirtschaft und Gesellschaft.

Im Monatsrythmus lädt ETH World zu Events ein, um über die Fortschritte des Programms zu informieren und interessante Entwicklungen und Technologien vorzustellen. Die Events bieten der wachsenden ETH-World-Community auch ein Forum für Weiterbildung und Erfahrungsaustausch.

Haben sie den Showcase-Event verpasst? Hier haben Sie die Gelegenheit per Video Streaming den Vortrag bequem vom Schreibtisch aus zu verfolgen:

www.ethworld.ethz.ch/events/showcase/showcase_pfister_DE

Beat Pfister erkennt in der Interdisziplinarität die grosse Chance für die Entwicklung sprachverarbeitender Systeme.

Obwohl die Interdisziplinarität zahlreiche Probleme aufwirft, wie Pfister betont, war es dennoch möglich, im Vergleich zu rein statistischen Verfahren die Trefferquote in der Spracherkennung um rund 50 Prozent zu erhöhen.

Gleiches Schriftbild, andere Lautfolge

Ansatzweise Spektakuläres hatte Pfister auch im Gebiet der Sprachsynthese vorzuweisen. So ist die Entwicklung inzwischen soweit, dass der Computer Sätze mit Wörtern aus verschiedenen Sprachen korrekt ausspricht.Beispielsweise erkennt Pfisters Sprachsystem, wann das Adjektiv „human“ englisch und wann es deutsch ausgesprochen wird.

Zurückhaltende Prognose

Aus Pfisters Forschungsprojekt entstand inzwischen eine Spinoff Firma, die sich mit der Entwicklung erster kommerzieller Applikationen befasst. Interesse an der Entwicklung im Gebiet der Sprachverarbeitung zeigen aber auch Microsoft und Sunrise. Microsoft beobachtet die Entwicklungen an der ETH aufmerksam und befasst sich im Hauptquartier in Redmond selbst mit der Entwicklung sprachverarbeitender Systeme. Aus Sicht eines Vertreters von Sunrise ist es jedoch noch zu früh, aus den Erkenntnissen der Sprachverarbeitung Schlüsse für mögliche Entwicklungen zu ziehen. Sowohl Microsoft wie Sunrise attestieren aber sprachverarbeitenden Systemen ein hohes Potential. Vorsichtig bezüglich der Prognose über mögliche Einsatzfelder in der Zukunft zeigte sich der Referent selbst. Er geht davon aus, dass sich die Spracherkennung insbesondere in kleinen Einsatzfeldern durchsetzen wird. Ein Beispiel dazu ist etwa die Bedienung des GPS-Navigationsgerätes im Auto.

Footnotes:

	(1)	Zu Beat Pfister und dem Institut für Technische Informatik und Kommunikationsnetze können Sie sich unter der folgenden URL weiter informieren: www.tik.ee.ethz.ch/
	(2)	Weitere Informationen zu ETH World und den nächsten Events finden Sie unter:www.ethworld.ethz.ch/

!!! Dieses Dokument stammt aus dem ETH Web-Archiv und wird nicht mehr gepflegt !!!
!!! This document is stored in the ETH Web archive and is no longer maintained !!!