Logo androidermagazine.com
Logo androidermagazine.com

Was ist Google Duplex?

Inhaltsverzeichnis:

Anonim

Bei Google I / O 2018 sahen wir eine Demo von Googles neuester cooler Sache, Duplex. Der 60-Fuß-Bildschirm auf der Bühne zeigte, wie Ihre Google Assistant-App aussieht, und zeigte eine zeilenweise Wiedergabe des Assistenten, der einen Anruf bei einem Friseur tätigt und einen Termin mit den Pausen, den Ummms und Ahhhs sowie dem Rest der Eigenheiten, die die menschliche Sprache begleiten. Die Person, die den Termin wahrnahm, schien nicht zu wissen, dass sie mit einem Computer sprach, weil es sich nicht nach einem Computer anhörte. Nicht mal ein bisschen.

Diese Art von Demo sieht toll aus (und vielleicht ein bisschen gruselig), aber was ist mit den Details? Was genau ist Duplex? Wie funktioniert es überhaupt? Wir alle haben Fragen, wenn wir etwas anderes sehen, und Antworten über das Internet zu finden, ist ein Schmerz. Sehen wir uns an, was wir bisher über Google Duplex wissen.

Was ist Google Duplex?

Laut Googles KI-Forschern und -Entwicklern ist es ein neues Tool von Google, das künstliche Intelligenz (KI) verwenden soll, um "reale Aufgaben über das Telefon zu erledigen". Das bedeutet vorerst sehr spezifische Aufgaben wie das Vereinbaren von Terminen, aber die Technologie wird mit Blick auf die Expansion in andere Bereiche entwickelt. Milliarden ausgeben, um einen coolen Weg zu finden, um Reservierungen für das Abendessen vorzunehmen, klingt wie etwas, das Google tun würde, ist aber kein guter Zeit- oder Geldverbrauch.

Duplex ist auch mehr als wir in einer Demo gesehen haben und wenn es jemals das Labor verlässt, wird es viel mehr sein, als wir am Ende sehen oder hören. Es gibt riesige Datenmengen und die Computer, auf denen sie verarbeitet werden, sind bei weitem nicht so cool wie das Endergebnis. Aber sie sind unerlässlich, weil es schwierig ist, einen Computer zum Sprechen zu bringen und in Echtzeit zu denken, wie eine Person.

Ist das nicht einfach wie eine Rede vor dem Text?

Nee. Nicht einmal annähernd. Und deshalb ist es eine große Sache.

Duplex wurde entwickelt, um die Art und Weise zu ändern, in der ein Computer auf dem Telefon "spricht".

Das Ziel von Duplex ist es, dass die Dinge natürlich klingen und der Assistent im Handumdrehen nachdenkt, um einen Termin zu finden, der funktioniert. Wenn Joe sagt: "Ja, darüber - ich habe bis 10 Uhr nichts offen, ist das in Ordnung?" Der Assistent muss verstehen, was Joe sagt, herausfinden, was das bedeutet, und überlegen, ob das, was Joe anbietet, für Sie funktioniert. Wenn Sie um 10 Uhr in der Stadt beschäftigt sind und die Fahrt zu Joes Garage 40 Minuten dauert, muss der Assistent in der Lage sein, das herauszufinden und zu sagen, 11:15 wäre gut.

Ebenso wichtig für Google ist, dass Duplex antwortet und sich wie eine Person anhört. Google wollte, dass die Person am Telefon nicht weiß, dass sie mit einem Computer spricht, entschied jedoch schließlich, dass es am besten ist, sie zu informieren. Wenn wir mit Leuten sprechen, sprechen wir schneller und weniger förmlich (sprich: aus der Sicht eines Computers inkohärentes Geschwätz) als wenn wir mit dem Assistenten auf unserem Telefon oder dem Computer in der DMV sprechen, wenn wir anrufen. Duplex muss verstehen dies und erstellen Sie es neu, wenn Sie antworten.

Am beeindruckendsten ist schließlich, dass Duplex den Kontext verstehen muss. Freitag, nächster Freitag und Freitag nach nächster Woche sind alles Begriffe, die Sie und ich verstehen. Duplex muss sie auch verstehen. Wenn wir so gesprochen hätten, wie wir es tippen, wäre das kein Problem, aber Sie wissen es nicht, weil es einfach so stickig klingt. Ja, es ist nicht verwirrend, obwohl wir es unser ganzes Leben lang gehört haben und daran gewöhnt sind Nein, wir haben keine Probleme.

Ich werde meinem Redakteur Erste Hilfe leisten, nachdem Sie das eingegeben haben, während Sie es laut aussprechen, damit Sie sehen, was dies bedeutet.

Wie funktioniert Duplex?

Vom Benutzer her ist es so einfach, wie dem Assistenten zu sagen, dass er etwas tun soll. Wie bereits erwähnt, beschränkt sich etwas darauf, Termine zu vereinbaren. Deshalb würden wir sagen: "Hey, Google macht mir einen Termin für einen Ölwechsel in Joes Garage am Dienstagmorgen", und (nachdem es uns daran erinnert hat, dies bitte zu sagen) würde es anrufen Richte Joes Garage ein, richte die Dinge ein und füge sie dann deinem Kalender hinzu.

Fortgesetzte Gespräche verwenden weitgehend die gleiche zugrunde liegende Technologie wie Duplex.

Ziemlich geschickt. Aber was außerhalb der Kamera passiert, ist noch raffinierter.

Duplex verwendet ein sogenanntes wiederkehrendes neuronales Netzwerk. Es basiert auf der TensorFlow Extended-Technologie von Google. Google hat das Netzwerk auf all die anonymisierten Voicemails und Google Voice-Konversationen geschult, die Sie zugelassen haben, wenn Sie sich für eine Mischung aus Spracherkennungssoftware und der Möglichkeit entschieden haben, den Verlauf der Konversation und Details wie Tageszeit und Ort zu berücksichtigen beider Parteien.

Im Wesentlichen verarbeitet ein ganzes Netzwerk von Hochleistungscomputern Daten in der Cloud und kommuniziert über Assistant auf Ihrem Telefon oder einem anderen Produkt mit Assistant an Bord.

Was ist mit Sicherheit und Datenschutz?

Es kommt auf eine einfache Sache an: Vertrauen Sie Google. Die Maschinenintelligenz auf dem Gerät ist eine echte Sache, obwohl sie eingeschränkt und relativ neu ist. Google hat das ML-Kit entwickelt, um Entwicklern dabei zu helfen, solche Aufgaben mehr auf dem Gerät selbst auszuführen, aber es ist alles eine Frage der Rechenleistung. Es sind unglaublich viele Berechnungen erforderlich, um einen Haartermin auf diese Weise zu vereinbaren, und auf Ihrem Telefon oder in Google Home ist dies auf keinen Fall möglich.

Sie müssen Google Ihre Daten anvertrauen, um die intelligenten Produkte von Google nutzen zu können. Duplex wird sich nicht unterscheiden.

Google muss einen Großteil Ihrer persönlichen Daten abrufen, um die besonderen Aufgaben von Assistant auszuführen, und Duplex ändert daran nichts. Neu ist, dass jetzt eine andere Partei involviert ist, die Google nicht ausdrücklich die Erlaubnis erteilt hat, ihre Konversation zu hören.

Wenn / wenn Duplex zu einem tatsächlichen Verbraucherprodukt für jedermann wird, ist mit einer gerichtlichen Kritik und Anfechtung zu rechnen. Und es sollte sein; Google entscheiden zu lassen, was für unsere Privatsphäre am besten ist, ist wie das alte Sprichwort von zwei Füchsen und einem Huhn, das entscheidet, was zu Abend gegessen wird.

Wann habe ich Duplex auf meinem Handy?

Erwarten Sie im Laufe dieses Jahres einige große Änderungen an Assistant.

Niemand weiß es jetzt. Es kann niemals passieren. Google ist aufgeregt, wenn es so etwas Fantastisches kann und es mit der Welt teilen möchte. Das bedeutet nicht, dass es erfolgreich sein oder jemals ein echtes Produkt werden wird.

Derzeit wird Duplex in einer geschlossenen und überwachten Umgebung getestet. Wenn alles gut geht, wird eine erste experimentelle Freigabe für Verbraucher, um Restaurantreservierungen vorzunehmen, Friseurtermine zu vereinbaren und telefonische Urlaubszeiten zu erhalten, später in diesem Jahr nur mit dem Assistenten für Telefone erfolgen.

Wo kann ich mehr erfahren?

Google ist überraschend offen für die Technologie, mit der Duplex erstellt wird. Relevante Informationen finden Sie auf folgenden Websites:

  • Google AI-Blog (Google)
  • Deepmind
  • Tensorflow.org
  • Die Cornell University Library
  • Google Research (Google)
  • Das Schlüsselwort (Google)
  • ML Kit (Google)

Natürlich verfolgen wir auch Duplex genau und Sie werden die neuesten Entwicklungen hier hören, sobald sie verfügbar sind.