Digital People: Vier Fragen, vier Antworten. Folge 6: Prof. Dr. Alexander Waibel
Prof. Dr. Alexander Waibel ist einer der führenden Wissenschaftler für automatische Spracherkennung und leitet das Interactive Systems Labs am Institut für Anthropomatik und Robotik an der KIT-Fakultät für Informatik. Seine Forschungsschwerpunkte liegen in den Themenfeldern maschinelles Lernen und Spracherkennung. Gemeinsam mit seinem Team hat er das weltweit erste Echtzeit-Sprachübersetzungssystem entwickelt, das am KIT und weiteren deutschen Hochschulen unter dem Namen Lecture Translator für die Simultanübersetzung von Vorlesungen eingesetzt wird.
1) In Ihrer Forschung beschäftigen Sie sich mit der automatisierten Erkennung und Übersetzung von Sprache. Unter anderem haben Sie und Ihr Team den Lecture Translator entwickelt. Was ist der Lecture Translator und was erforschen Sie dazu?
Schon von Anfang meiner wissenschaftlichen Karriere an fasziniert mich die Vielfalt der Sprachen, die zweifelsohne einen bedeutenden Bestandteil unserer Kultur ausmacht. Die Globalisierung brachte auch den Wunsch und die Notwendigkeit mit sich, multikulturelle Kommunikation zu intensivieren – aber in welcher Sprache? Theoretisch könnte jeder mit jedem auf der Welt sprechen, fast jeder hat heute ein Smartphone, aber die Sprachbarriere ist nach wie vor ein Hindernis. Genauso wie auch für die ausländischen Studierenden, die ans KIT kommen und bei uns studieren wollen. Deutsch zu lernen, bis die Sprache so weit beherrscht wird, dass wissenschaftliche und technische Präsentationen mit anspruchsvollem Inhalt, wie beispielsweise Vorlesungen, verstanden werden können, braucht Jahre. Da Dolmetscher zu teuer wären, haben wir ein selbstlernendes System zur automatischen Simultanübersetzung von Vorlesungen entwickelt. Der Vortragende hält seine Vorlesung auf Deutsch, die gesprochene Sprache wird verschriftet und in verschiedene Sprachen übersetzt. Die Studierenden lesen dann über eine Website die Spracherkennung und/oder die Übersetzung wie Untertitel bei einem Film. Das System kommt dabei nicht nur ausländischen Studierenden zugute, sondern unterstützt auch hörgeschädigte Teilnehmer, die das gesprochene Wort des Vortragenden als Untertitel mitlesen.
2) Auch in der Informatik entwickeln sich stetig neue Prozesse und Werkzeuge. Welche Rolle spielt künstliche Intelligenz und neuronale Netze in der Entwicklung des Lecture Translators?
Künstliche Intelligenz (KI) und neuronale Netze haben den Lecture Translator deutlich schneller und präziser gemacht. Die Latenz liegt bei der Erkennung bei nur noch ein bis zwei Worten, bei der Übersetzung bei etwa einem halben Satz. Dies bedeutet, dass Worte in der Übersetzung bereits ausgegeben werden müssen, bevor der Sprecher einen Satz zu Ende gesprochen hat. Zu den Erfolgen heutiger KI trägt auch die erhöhte Rechnerleistung stark bei. Unsere Arbeiten haben schon in den 80er Jahren an den lernenden Technologien begonnen: Bereits 1987 haben wir das erste neuronal lernende System im Bereich Sprache und Übersetzung vorgestellt (das TDNN, heute Convolutional Neural Network), das nun einen der wichtigsten Grundbausteine künstlich intelligenter Systeme darstellt.
3) Was denken Sie: Welche Chancen ergeben sich im Hochschulalltag durch die Verfügbarkeit der Simultanübersetzung in Form des Lecture Translators im Hörsaal?
Ich denke, es ergeben sich riesige und sehr vielfältige Chancen. Wir haben jetzt die einzigartige Möglichkeit, dass Studierende, die die deutsche Sprache gar nicht oder nicht gut genug beherrschen, um einer Vorlesung auf Deutsch zu folgen, hier am KIT oder an einer anderen deutschen Hochschule studieren können. Das Studium für hörgeschädigte Personen wird viel einfacher, die Studierenden können aktiver am Unterricht teilnehmen. Ein Beispiel: An meiner Vorlesung nimmt eine hörgeschädigte Studentin teil, die der Vorlesung u.a. über den Vorlesungsübersetzer folgt. Sie war in der letzten Vorlesung die einzige Studierende, die auf meine Frage die richtige Antwort geben konnte! Allein die Verbesserung der Lebensqualität für diese Studentin war die ganze Arbeit wert. Unser System läuft mittlerweile so stabil, dass es nun auch an anderen Universitäten im Testbetrieb ist und wir damit einer noch größeren Zahl von Studierenden in ganz Deutschland Unterstützung anbieten können. Außerdem lassen sich auch noch viele weitere Anwendungsmöglichkeiten sehen: Ein Professor könnte seine Vorlesung auf Portugiesisch halten und wir würden sie ins Deutsche übersetzen. MOOCs oder Fortbildungen haben wir auch schon untertitelt und übersetzt, und Migranten aus Krisengebieten haben wir bei ihrer ärztlichen Betreuung unterstützt – unser System kann in meinen Augen die Welt verändern.
4) Mit dem ZML haben Sie zwei Massive Open Online Courses (MOOCs) in einem Projekt umgesetzt. Wieso haben Sie sich für den Einsatz von MOOCs entschieden und wo sehen Sie Chancen in deren Nutzung?
MOOCs erreichen im Verhältnis zu Vorlesungen einen weltweiten Nutzerkreis. Jeder, der Zugriff zum Internet hat, kann sich über den MOOC weiterbilden. Allerdings haben wir auch hier wieder die Sprachbarriere und um die MOOCs möglichst vielen Interessierten zugänglich zu machen, haben wir sie in verschiedene Sprachen automatisch übersetzt. Nicht zuletzt erhöht ein MOOC die internationale Sichtbarkeit unserer Hochschule und zeigt noch einmal deutlich unser wissenschaftliches Niveau.
Vielen Dank Herr Prof. Dr. Waibel für das Interview!