Aristech
Aristech GmbH | |
---|---|
Aristech Logo.jpg | |
Rechtsform | Gesellschaft mit beschränkter Haftung |
Gründung | 2010 |
Sitz | Heidelberg |
Leitung | Michael Mende |
Branche | Software Entwicklung / TTS / Spracherkennung |
Website | www.aristech.de |
Stand: Mai 2015 |
Die Aristech GmbH, 2010 in Heidelberg (Deutschland) gegründet, ist ein Anbieter natürlich sprachlicher Mensch-Maschine-Interaktion (MMI). Das Unternehmen bietet Lösungen im Bereich der Sprachsynthese und Spracherkennung an. Laut eigenen Angaben ist Aristech der einzige unabhängige deutsche Text-to-Speech (TTS) – Anbieter mit eigener Entwicklung.[1]
Inhaltsverzeichnis
[Verbergen]Hintergrund[Bearbeiten]
Aristech begann hauptsächlich mit der Vermarktung von Sprachtechnologielösungen. 2012 kam es dann zum Aufsetzen eigener Produktlinien. Dazu gehört die Sprachsynthese in Zusammenarbeit mit CereProc Ltd. zur Erstellungvon TTS Standardstimmen und kundenexklusiven sogenannten „Corporate Voices“, welche sowohl ein- als auch mehrsprachig angeboten werden.
Des Weiteren war Aristech Teil eines Konsortiums des von der Europäischen Union ausgeschriebenen Projektes Generic Adaptive Middleware for Behavior-driven Autonomous Services ([GAMBAS).[2]
Nutzer[Bearbeiten]
TTS und Spracherkennung finden heute in vielen Bereichen Anwendung. Dementsprechend weit gefächert sind auch die Nutzer der von Aristech angebotenen Technologien. Ein Auszug:
- Die Österreichischen Bundesbahnen (ÖBB) stellen ihre Systeme auf Aristech-Sprachtechnologie um, damit die sympathische Stimme Chris Lohners dauerhaft für beliebige neue Ansagen eingesetzt werden kann. Die berühmte Österreichische Schauspielerin ist schon seit 1981 die Stimme der ÖBB.[3][4] Auch die Fahrkartenautomaten sollen per Sprache steuerbar werden.[5]
Mit dem Klonen der Stimme steigt Aristech in die Fußstapfen des englischsprachigen Partners CereProc Ltd. der die Stimme des Filmkritikers Roger Ebert digitalisierte.[6] Eberts hatte seine Fähigkeit zu sprechen durch eine Erkrankung an Schilddrüsenkrebs verloren.
Mit Chris Lohners Stimme wurde nun auch eine deutschsprachige Schauspielerin geklont. Sie selbst sagte dazu in einem Interview zur Neueröffnung des Wiener Hauptbahnhofes: „Das ist ein kleines Denkmal das ich mir jetzt selber mache […]. Weil wenn's mich auch nicht mehr gibt oder ich mir die Radieschen von unten angucke, werde ich immer noch die Bahnhofs-Ansagen machen.“ [7] - Eine SAP-App nutzt sowohl die Spracherkennung, als auch die Sprachausgabe von Aristools – einer mobilen App-Lösung von Aristech – im Gesundheitswesen. Dies ermöglicht es, dass Ärzte Daten in ein mobiles Endgerät unter Verwendung ihrer natürlichen Sprache einsprechen.[8] Diese Informationen werden in das SAP-System SAP EMR Unwired eingepflegt und können jederzeit wieder sprachlich ausgegeben werden. Entsprechendes funktioniert auch für SAP Retail Execution. Auch hier können Anwender Informationen mit Hilfe ihrer Sprache in das System einpflegen, welches diese Daten dann verarbeitet und entsprechende Konsequenzen daraus zieht; wie zum Beispiel das Tätigen relevanter Bestellungen.[9]
- SWR und WDR nutzen die Sprachtechnologie von Aristech für ihre automatisierte Stauhotline.[8][10]
- Das LUBW gibt nutzt sowohl Spracherkennung als auch TTS für die telefonische Pegelstandansage.
- Borealis stattet ihr internes E-Learning mit Aristech TTS-Stimmen aus.
- Oertli Instruments setzt die Aristech TTS-Stimmen in Medizinalgeräten für die Augenheilkunde ein.
- Per Text-to-Speech generierte Meldungen werden in die Einsatzfahrzeuge des Notruf 144 Niederösterreich übermittelt.
- Die Deutsche Bahn stellt ihren Lokomotivführern mithilfe computergenerierter Nachrichten Meldungen bereit, die den Betriebsablauf betreffen.
- Die Fahrkartenautomaten der OÖVV sind durch die Sprachtechnologie barrierefrei.
- Geldautomatenausstatter nutzen von Aristech bereitgestellte Werkzeuge um ihre Automaten barrierefrei zu gestalten.
Arbeitsweise bei der Sprachsynthese[Bearbeiten]
Die Erstellung der Sprache erfolg durch eine Unit Selection Synthese, welche auf einer großen Datenbank gesprochener Informationen eines Sprechers basiert. Diese gesprochenen Informationen werden bei der Erstellung der Datenbank in unterschiedlich große Segmente geteilt: Phoneme, Silben, Morpheme, Wörter, Phrasen und Sätze. Basierend auf diesen Segmenten, sowie akustischer Parameter wie Frequenz, Dauer und Position wird ein Index diverser Einheiten erstellt. Während der Synthese werden diese Einheiten unter Berücksichtigung der größten passenden Segmente, sowie passender Parameter herangezogen (vgl. hierzu auch unter Sprachsynthese: Synthese). Der Schwerpunkt der Aristech GmbH liegt auf der semantischen Vorverarbeitung wodurch eine gute Aussprache von Zahlen, Abkürzungen und Anglizismen gewährleistet werden kann. Hinzu kommt eine allgemeine Analyse der Daten zur Optimierung der Prosodie.
Stimmen und Sprachen[Bearbeiten]
Auf der Website von Aristech sind momentan insgesamt 27 verschiedene Stimmen in 9 Sprachen zu finden.
Kompatibilität[Bearbeiten]
Aristech Tools sind kompatibel mit allen gängigen Betriebssystemen wie Microsoft Windows, Mac OS X und Linux.
Weblinks[Bearbeiten]
- Aristech Website
- Wenn der Computer wie ein Mensch spricht Beitrag zur Sprachsynthese mit Bezug zur Aristech GmbH im Deutschlandradio
Einzelnachweise[Bearbeiten]
- Hochspringen ↑ Pressebox Die TTS-Experten aus Deutschland
- Hochspringen ↑ Presse Echo High Tech aus Heidelberg: Intelligente Mobilitätsplanung dank Geräusch- und Spracherkennung
- Hochspringen ↑ Software aus Heidelberg gibt der Stimme der ÖBB einen großen Auftritt. In: Verkehr und Technik. Nr. 4, 2015, S. 151
- Hochspringen ↑ Heidelberger Technologie an österreichischen Bahnhöfen. In: IHK-Magazin. April 2015, S.36
- Hochspringen ↑ Aufgeschnappt. In: Wirtschaftswoche. Nr. 7, 2015, S. 9
- Hochspringen ↑ CereProc.com CereProc's Wonder Emporium of Text-to-Speech – Cloning Voices.
- Hochspringen ↑ „Ich werde noch aus dem Grab moderieren“, 10. Oktober 2014, 5'14 – 5'30
- ↑ Hochspringen nach: 8,0 8,1 ARD Mediathek Wie funktionieren Computerstimmen á la Siri?
- Hochspringen ↑ Business-Rhein-Neckar.de Aristools steuert SAP-Apps mit natürlicher Sprache.
- Hochspringen ↑ Mannheimer Morgen Die menschliche Computerstimme