Die Vorstellung ist faszinierend: Mails, Blog-Einträge und sonstige Texte werden bequem diktiert, während die nur noch für Notfälle benötigte Tastatur im Regal verstaubt. Ganz so einfach ist es allerdings selbst nach jahrzehntelanger Sprachsoftware-Entwicklung leider immer noch nicht. Diktier- und Sprachsteuerlösungen werden jedoch immer ausgereifter und sind im Alltag bereits eine echte Alternative zum Tippen.
Nuance möchte mit Dragon Dictate 4 nicht nur Diktier- und Transkribierbedürfnisse befriedigen, sondern zudem umfangreiche Sprachsteuermöglichkeiten für den Mac bieten. Ob Dragon Dictate wirklich DIE Universallösung für Diktate, Transkriptionen und Sprachbefehle unter OS X ist, zeigt folgender Test.
Installation
Da Dragon Dictate (noch?) nicht im App Store erhältlich ist, muss die Software mittels DMG-Datei installiert werden. Diese erhält der Nutzer auf der Seite des Dragon-Dictate-Entwicklers Nuance. Ist alles installiert, geht es an das Sprachtraining. Zwar funktioniert Dragon zur Not auch ohne – für bessere Ergebnisse ist es aber in jedem Fall zu empfehlen.
Das Basis-Training dauert ca. 10 Minuten und besteht darin, einen Text inklusive der Satzzeichen vorzulesen. Übrigens wird für jedes verwendete Mikrofon und jeden einzelnen Nutzer eine gesonderte Profildatei angelegt; das heißt, dass es separate Profile z.B. für das interne iMac-Mikro und ein externes Mikro gibt, welches wegen der besseren Texterkennung immer zu bevorzugen ist.
Anhand der aus dem Training gewonnenen Daten erstellt Dragon ein Nutzerprofil, das für Sprechtempo und Betonung des Diktierenden optimiert wird. Nach dem Trainings-Text benötigt Dragon nochmal ein paar Minuten, um die gewonnenen Daten zu verarbeiten und das Profil anzulegen.
Befehle
Bevor es zu der Kernfunktion, dem Diktieren, geht, soll kurz gezeigt werden, welche Sprachsteuer-Möglichkeiten die Software bietet. Der Programmstart dauert immer etwas, weil Dragon die individuelle Profildatei eines Nutzers erst laden muss – am besten also das Programm bei regelmäßigem Gebrauch zu den Anmeldeobjekten hinzufügen, die beim Systemstart automatisch geladen werden.
Da Dragon aber auch schonmal zu Abstürzen neigt, muss die App eventuell doch das ein oder andere Mal neu gestartet werden inklusive der damit verbundenen Wartezeit – aber dazu später mehr.
Dragon Dictate macht sich durch ein Symbol in der Menüleiste und ein kleines Fenster bemerkbar, das beliebig auf dem Desktop platziert werden kann und den Status (Ruhemodus/Bereit/etc.) anzeigt; im Dragon-Fenster ist der schnelle Wechsel zwischen verschiedenen Modi, etwa vom Befehls- zum Diktiermodus, auch per Klick möglich.
Einmal gestartet achtet das Programm im Hintergrund permanent auf Sprachbefehle, was ein großer Vorteil zu der in OS X integrierten Diktierfunktion ist – diese kann nur innerhalb eines Programms genutzt werden. Zudem bietet Dragon die bessere Texterkennung, was etwas verwundert, da Apple die OS-X-Diktierfunktion von Dragon-Entwickler Nuance lizensiert hat.
Die App aktiviert nach einer bestimmten Zeit allerdings den Ruhemodus, den der Nutzer erst mit dem Befehl „Wach auf!“ beenden muss, bevor weitere Spracheingaben möglich sind.
Ist Dragon bereit, lassen sich unter anderem Programme starten („Öffne…“) und beenden („Schließe…“). Tastenkürzel können ebenso mündlich erfolgen, um etwa Text aus der Zwischenablage zu kopieren („cmd+V“).
Die Steuerung beschränkt sich aber nicht auf die Betriebssystem-Ebene – auch innerhalb eines Dokumentes ist eine mündliche Navigation möglich (Auswahl bestimmter Wörter, Sprung zum Beginn oder Ende eines Dokuments); wobei Apples Pages von allen Textverarbeitungsprogrammen am besten von Dragon unterstützt wird.
Außerdem ist es möglich, im Browser mit installiertem Dragon-Plugin (Safari/Firefox) auf Links zu klicken und das Web-Interface von Gmail allein mit Dragon Dictate zu nutzen – vom Öffnen der Webseite bis zum Mail-Versand.
Freihändige Steuerung und Navigation in Dokumenten sind mit dem Programm also rudimentär durchführbar. Oft führen Maus und Tastatur aber schneller zum Ziel – nicht nur wegen der gewohnten Bedienung, sondern auch aufgrund der nicht immer direkt verstandenen Befehle.
Diktieren
Mit „Diktiermodus!“ startet der Nutzer die Kernfunktion von Dragon Dictate. Laut Nuance schafft die App bis zu 160 Wörter pro Minute; im Test wurden gesprochenen Texte schnell erkannt und praktisch umgehend verschriftlicht. Die Angabe des Entwicklers ist also nicht übertrieben. Damit Eingaben noch besser verstanden werden, sollten Nutzer außer dem Basis-Training zu Beginn noch weitere Übungs-Sessions einlegen ("Werkzeuge" > "Sprachtraining").
Da sich Dragon nach einer gewissen Zeit in den Ruhezustand verabschiedet, beginnen die meisten Diktate mit dem Befehl „Wach auf!“. Wir haben die Diktierfunktion sowohl mit dem integrierten Mikrofon des iMac als auch mit dem USB-Kondensatormikrofon Blue Snowball getestet, wobei die Lösung mit externem Mikrofon durchgängig bessere Ergebnisse lieferte – die Anschaffung eines solchen lohnt sich also in jedem Fall. Beim Kauf der Versandversion von Dragon Dictate ist sogar ein Nuance-zertifiziertes geräuschunterdrückendes Headset-Mikrofon enthalten.
Bei englischen Begriffen und Namen stößt die Texterkennung leider schnell an die eigenen Grenzen – „iOS“ etwa wird nie richtig erkannt und immer anders hingeschrieben (z.B. „eines“); „Tim Cook“ wird zu „dem kuck“ und „Beats Music“ kurioserweise zu „Beatles Musical“.
Dragon bietet Nutzern für solche Fälle einen Wortschatz-Editor. Dort kann der User dem Programm unter anderem englische Begriffe antrainieren und erreicht mit etwas Eigeninitiative, dass Dragon z.B. „Youtube“ auch als „Youtube“ erkennt. Zur Not gibt es noch den Buchstabier-Modus, über den jedes Wort Buchstabe für Buchstabe eingegeben wird.
Transkribieren
Was aber, wenn man grade nicht am Rechner sitzt und eine Sprachnotiz mit dem Smartphone aufnimmt? Kein Problem: Genau wie die Live-Spracheingabe kann Dragon gespeicherte Sprachnotizen ebenfalls in Text umwandeln. Dazu muss die entsprechende Datei (.mp3, .aiff, .wav, .mp4, .m4a oder .m4v) lediglich auf den Mac übertragen werden.
Die Texterkennung ist auf ähnlichem Niveau wie beim normalen Sprechen, wenn auch Satzzeichen nicht ganz so zuverlässig erkannt werden. In jedem Fall eine praktische Funktion für alle Sprachnotizen, die im Laufe des Tages anfallen.
Stabilität
Was die reine Spracherkennung angeht, ist Dragon Dictate 4 zwar zu empfehlen und immer der in OS X integrierten Diktierfunktion vorzuziehen – nicht nur wegen der Möglichkeit, Befehle einzugeben und so das System zu steuern; vor allem die wesentlich bessere Erkennungsrate überzeugt.
Die Qualität eines Programms hängt aber eben nur zum Teil von der Funktionalität ab. Genauso wichtig ist, dass eine App das Leistungspotential auch zuverlässig „auf die Straße“ bringt. Und genau da hapert es bei Dragon, da das Programm zu Abstürzen und seltsamem Verhalten neigt.
Dragon verabschiedet sich immer mal wieder ohne ersichtlichen Grund mit einer Fehlermeldung, was jedes Mal einen Programm-Neustart inklusive Laden des Nutzer-Profils zur Folge hat – nervig! Dabei kann keine bestimmte Situation rekonstruiert werden, die Dragon abstürzen lässt. Ob während eines Diktats oder im Idle-Modus – die Abstürze scheinen willkürlich zu sein und nicht vom Nutzerverhalten beeinflusst zu werden.
Auch die Browser-Plugins (Safari/Firefox) sind verhaltensauffällig. Der Nutzer muss mit sporadischen Ausfällen und Fehlermeldungen leben; so warnt das Dragon-Plugin für Safari von Zeit zu Zeit, dass die falsche Version installiert sei und verweist den verdutzten Nutzer auf die Nuance-Homepage – von dort wurde jedoch vorher schon die neueste Version des Plugins heruntergeladen. Auch eine Neuinstallation des Plugins schafft keine Abhilfe.
Es ist diese Kombination aus sporadischen Abstürzen und anderen Ungereimtheiten, die die Geduld des Users immer wieder auf die Probe stellt und leider einen kleinen Schatten auf die gute Texterkennung wirft.
Fazit
Dragon Dictate 4 ist eine gute Texterkennungs-App, die wegen der sporadischen Abstürze aber einen etwas schalen Beigeschmack hinterlässt. Wer sich daran nicht stört, erhält eine mächtige Spracherkennungs-Suite, die der integrierten Lösung in OS X weit überlegen ist.