Wem gehört die Stimme in der Autonavigation?

Warum beschleunigt HBO Max einige Serien und Filme


Statue Sophia Twit

„Wir nennen sie Karin“, schrieb Christine van Dijk-Melis vor einiger Zeit an den Service Desk. Karin ist die Stimme ihres Navigationssystems im Straßenverkehr. Wie funktioniert das mit diesen Stimmen, die einem sagen, wohin man gehen soll, fragt sie sich. Gibt es irgendwo eine Firma, bei der Hunderte von Karins die gesamte Beschilderung aller Straßen auf der ganzen Welt aufgezeichnet haben? Und dann auch noch in verschiedenen Sprachen?‘

Da ist zum einen eine echte Karin, die unter anderem den Navigationsboxen von Garmin und Telefonen ihre Stimme leiht. Ihr Name ist Karen Jacobsen, eine in Australien geborene amerikanische Sängerin. 2002 wurde sie für ein neues Text-to-Speech-System gerufen. Eine Person spricht Sätze, die in Stücke geschnitten und gemischt werden, sodass neue Sätze laut vorgelesen werden können. Auch die NS-Rundfunkstimme auf der Plattform funktioniert so.

Karen Jacobsen hat fünfzig Stunden lang ihre Stimme aufgenommen, und jetzt hören Millionen von Menschen auf der ganzen Welt sie sagen, dass sie ihr Ziel erreicht haben. Jacobsen baute eine Marke um ihre Stimme auf. Als „The GPS Girl“ hält sie mit Titeln wie „It’s never too late to change the route“ aufmunternde Reden darüber, was man aus dem Leben machen kann.

Auch bei TomTom seien es Menschen, die die Sätze aufzeichnen, schrieb ein Unternehmenssprecher per E-Mail. TomTom verwendet auch computergenerierte Stimmen, hauptsächlich für Straßennamen. Diese Computerstimmen sind nicht so gut wie die von Menschen, also werden die Anweisungen immer von einem Menschen ausgesprochen.

Um eine Navigationsstimme aufzunehmen, wird zunächst ein Skript benötigt. Beispielsweise geht es bei der Navigation auf Französisch nicht darum, eins zu eins aus dem Niederländischen zu übersetzen. Nicht alle Sprachen haben die gleichen grammatikalischen Regeln, also macht man nicht in jeder Sprache auf die gleiche Weise einen neuen Satz aus abgeschnittenen Teilen eines anderen Satzes. Zum Beispiel haben japanische Verben keine Zukunftsform, nur eine Vergangenheitsform und eine Gegenwartsform. Ein Schauspieler braucht einen Tag, um alle Wortkombinationen aufzunehmen. Dann ist eine Nachbearbeitung und Montage erforderlich. Der gesamte Prozess dauert ein bis drei Monate.

Wie wird eine solche Stimme gewählt? Es ist offensichtlich, aber die Stimme auf dem Weg sollte nicht zu eindringlich und gut artikuliert sein. Damit der Fahrer auf einer stark befahrenen A16 nicht durch etwas Verrücktes in der Navigation abgelenkt wird. Eigentlich sollte man Karin im Auto gut hören können, aber ansonsten vergiss es.

Sie können sich mit Fragen zu Technologie in unserem täglichen Leben und unserer digitalen Existenz an De Servicedesk wenden. Hast du eine Frage? Fragen Sie ihn unter [email protected].



ttn-de-23

Schreibe einen Kommentar