Der Leiter des Apple-Redeteams erklärt, wie Siri neue Sprachen lernt

Wie genau lernt Siri eine neue Sprache? Im heutigen Interview mit Reuters gab Alex Acero, der Leiter des Apple-Redeteams, einen Blick hinter die Kulissen, wie Siri neue Sprachen beigebracht werden. Dabei geht es um das Schreiben von Skripten, das Erfassen von Stimmen in mehreren Akzenten und Dialekten sowie den Einsatz von maschinellem Lernen und künstlichem Lernen Intelligenz, um im Laufe der Zeit neue Sprachmodelle aufzubauen und weiterzuentwickeln. Das System erfordert ein Team von Personen, die mit dem Lesen von manuell transkribierten Textpassagen beauftragt sind.

Vor dem eigentlichen Update von Siri führt Apple zunächst die Diktatunterstützung für eine neue Sprache ein.

Siri spricht derzeit 21 Sprachen in 36 Ländern. Zum Vergleich: Cortana von Microsoft unterstützt acht Sprachen, die auf dreizehn Länder zugeschnitten sind. Google Assistant spricht vier Sprachen, während Alexa von Amazon nur auf Englisch und Deutsch funktioniert.

Siri eine neue Sprache beizubringen beinhaltet die folgenden Schritte:

  • Menschen lesen benutzerdefinierte Textpassagen in einer Reihe von Akzenten und Dialekten
  • Die Aufnahmen werden von Hand transkribiert, sodass Siri genau weiß, was es zu lernen gilt
  • Sie erfassen auch Geräusche in einer Reihe von Stimmen
  • Es wird ein neues Sprachmodell erstellt, das versucht, Wortfolgen vorherzusagen

Apple führt die Diktatunterstützung für die neue Sprache ein, bevor sie zu Siri hinzugefügt wird. Aus diesem Grund unterstützt die Diction-Funktion mehr Sprachen als Siri (das bevorstehende Software-Update für macOS Sierra 10.12.4 ermöglicht beispielsweise die Diktatunterstützung für Shanghainese, einen chinesischen Dialekt nur um diese Stadt).

Mit Diktieren kann Apple anonymisierte Audioaufnahmen mit Hintergrundgeräuschen und gemurmelten Wörtern aufnehmen. Das Audio wird manuell von Menschen transkribiert, ein Prozess, der laut Acero dazu beiträgt, die Spracherkennungsfehlerrate zu halbieren.

Erst wenn genügend Daten gesammelt wurden, beauftragt Apple einen Schauspieler, Stimmen für Siri aufzunehmen. Wenn eine neue Siri-Sprache zur Hauptsendezeit verfügbar ist, wird sie mit Antworten auf die Schätzungen von Apple veröffentlicht, die am häufigsten gestellt werden.

Apple hat große Summen in künstliche Intelligenz und maschinelles Lernen investiert, damit sich die Sprachmodelle im Laufe der Zeit weiterentwickeln können, wenn Siri mehr über die Fragen der Benutzer erfährt.

Sie aktualisieren Siri alle zwei Wochen mit weiteren Verbesserungen, sagte Acero.

Abonniere iDownloadBlog auf YouTube

Laut Charles Jolley, dem Erfinder eines intelligenten Assistenten namens Ozlo, besteht ein mögliches Problem bei der Vorgehensweise von Apple darin, dass Sie nicht genügend Autoren einstellen können, um das System zu entwickeln, das Sie in jeder Sprache benötigen.

Andere persönliche Assistenten, einschließlich Google Now und Microsoft Cortana, verringern das Problem der Skalierung, indem sie die Antworten zusammenfassen, was Siri nicht sehr gut kann.

Viv, ein Start-up, das von Siris ursprünglichen Entwicklern gegründet wurde, die Samsung letztes Jahr erworben hat, arbeitet genau daran. "Die einzige Möglichkeit, die heutigen Versionen mit eingeschränkten Funktionen zu überspringen, besteht darin, das System zu öffnen und sie von der Welt unterrichten zu lassen."

Obwohl Siri jetzt mehr Sprachen spricht als ihre Rivalen (Google und Amazon haben angekündigt, ihren jeweiligen Assistenten mehr Sprachen anzubieten), bleibt dem Benutzer immer noch eine unterdurchschnittliche Erfahrung, da andere Assistenten, wie bereits erwähnt, den Kontext besser verstehen und Bereitstellen von mehr Konversationsantworten.

Die 200-Millionen-Dollar-Akquisition des australischen Startups Turi für maschinelles Lernen durch Cupertino im August 2016 soll dazu beitragen, Siris Sprach- und Wissensmodelle zu verbessern.

Es wird erwartet, dass Apple auf seiner jährlichen Pilgerreise für Entwickler, die am 5. Juni mit einer Keynote beginnt, verbesserte Siri-Funktionen demonstriert (die möglicherweise nur für das iPhone 8 gelten). Zu den Verbesserungen von Siri gehört möglicherweise die Unterstützung mehrerer Sprachen.

iOS 10 unterstützt das Eingeben in zwei Sprachen, ohne dass die Tastatur gewechselt werden muss, sodass Siri möglicherweise bald mehrere Sprachen versteht, ohne dass Sie manuell eine Sprache auswählen müssen Einstellungen → Siri → Sprache?

Ein mehrsprachiger Siri sollte auch auf Apple TV hervorragend funktionieren.

Ein Interview mit mehreren Apple TV-Projektmanagern im November 2015 schlug vor, dass Apple Siri anfangs auf die Set-Top-Box auf nur acht Länder beschränkt hatte, da die Aussprache von Schauspielernamen, Filmen und Regisseuren in verschiedenen Sprachen und Dialekten unterschiedlich war.

Quelle: Reuters