Am Ende war das Wort

16. April 2007 Schreibe einen Kommentar

Thomas Hillenbrand, Helene Laube und Arndt Ohler
Finnacial Times Deutschland, 16.04.2007

Ausgefeilte neue Software zur Spracherkennung macht Gesprochenes und Geschriebenes austauschbar. Eine neue Chance für Google & Co. – in Zukunft werden sich selbst Telefonate durchsuchen lassen.

Wenn es um das schnelle Schreiben von Texten geht, tippt Ben Cook normalerweise außer Konkurrenz. Der US-Teenager hat es als schnellster SMS-Texter der Welt ins Guinnessbuch der Rekorde geschafft. Vergangenen Herbst musste Cook jedoch eine schmachvolle Niederlage einstecken: 42 Sekunden brauchte er bei einem Wettbewerb für den Satz „Mit ihren rasiermesserscharfen Zähnen sind die Piranha-Arten Serrasalmus und Pygocentrus die aggressivsten Süßwasserfische der Welt. Tatsächlich greifen sie Menschen aber nur selten an.“ Cooks Gegner, eine Spracherkennungssoftware des US-Unternehmens Nuance Communications, transkribierte den Zungenbrecher in nur 16 Sekunden. „So geschlagen zu werden lehrt einen Demut“, sagt Cook.

Seit Jahren verspricht die IT-Industrie perfekt arbeitende Spracherkennungssoftware. Nun scheint der Durchbruch gelungen zu sein: Neue, leistungsfähige Programme können Gespräche nahezu fehlerfrei in Text umwandeln – das gesprochene und das geschriebene Wort werden damit weitgehend austauschbar. Die neue Technologie hat das Potenzial, die Telekommunikation und das Internet auf den Kopf zu stellen.

Diktiersoftware wie Dragon Naturally Speaking (Nuance) ist nur der Anfang. Mehrere Firmen bieten jetzt erste Sprach-Text-Konvergenzprodukte. Der US-Dienst Simulscribe etwa wandelt alle auf der Handy-Mailbox eingehenden Nachrichten automatisch in E-Mails um. Die kann der Nutzer dann zum Beispiel während eines Meetings auf dem Laptop lesen. Alte Nachrichten speichert Simulscribe als Text- und Audiodatei in einem durchsuchbaren Archiv ab.

Das ist erst der Anfang. Bald schon könnten Dienste auf den Markt kommen, die ganze Telefonate automatisch transkribieren, archivieren und indexieren. Ähnlich wie Textdokumente wären dann Telefongespräche, Radiobeiträge oder TV-Shows jederzeit per Google- oder Yahoo-Suche auffindbar.

Ein Beispiel: Das US-Startup Callwave arbeitet an einem Programm namens Vtext, das Spracherkennungs- und Suchtechnologie kombiniert. Ähnlich wie bei Simulscribe werden Mobilbox-Nachrichten verschriftet. Zusätzlich erstellt die Software jedoch ein Kurzprotokoll – mit Name und Anliegen des Anrufers. „Viel beschäftigte Geschäftsleute wollen vor allem wissen, ob sie gleich zurückrufen müssen oder ob es Zeit hat“, sagt Callwave-Chef David Hofstatter.

Inzwischen arbeiten auch die Dickschiffe der Suchindustrie fieberhaft an eigenen Diensten. Google startete vergangene Woche eine komplett computergesteuerte Telefonauskunft. Der Nutzer spricht seine Frage bei Google 411 in den Hörer, Software wandelt sie in eine Sucheingabe um. Auch Googles Konkurrent Yahoo hat das Thema auf dem Radar. „Wir werden ebenfalls Spracherkennung haben“, sagt Jeff Bonforte, zuständiger Manager des US-Internetportals. Es gebe, meint der Yahoo-Stratege, „lediglich zwei Unternehmen, die ausreichend intelligente Suchsysteme besitzen, um dies zu verwirklichen“ – Google und Yahoo.

Möglicherweise hat Bonforte die Rechnung ohne Microsoft gemacht. Der Windows-Konzern investiert seit Jahren in Spracherkennung. Vergangenen Monat kaufte der weltgrößte Softwarehersteller für mehr als 800 Mio. $ den kalifornischen Spezialisten Tellme Networks. Der betreibt sprachgesteuerte Hotlines für UPS oder American Airlines.

Tellmes Technologie dürfte demnächst auch in Microsoft-Produkten auftauchen. Besonders vielversprechend scheint der Ansatz, Telekommunikationsdienste in Outlook zu integrieren: Die Bürosoftware könnte Telefonate und Sprachnachrichten ebenso archivieren wie E-Mails.

Während am heimischen PC wohl noch einige Zeit getippt wird, wird sich Spracherkennung bei mobilen Geräten zügig durchsetzen, glaubt Tellmes Co-Gründer Mike McCue. „Sprache ist für mobile Anwendungen das, was die Maus für den PC ist“, sagt er.



Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.