Inhaltsverzeichnis:
Was du wissen musst
- Google trainiert seine KI, um Tiefenkarten zu erstellen, die menschliche Objekte in der Szene mit nur einer Kamera isolieren.
- Als Ausgangspunkt verwendete Google 2000 YouTube-Videos der Mannequin Challenge, um die KI zu trainieren.
- Die Ergebnisse ermöglichen das Hinzufügen von Effekten zu Videos, z. B. zum Hochformat, und die Verwendung für Augmented Reality.
In einem kürzlich veröffentlichten Blog-Beitrag hat Google detailliert beschrieben, wie die Tiefenwahrnehmung in Videos, in denen sich Kamera und Motiv bewegen, verbessert wurde. Als Ausgangspunkt benötigte die Studie Zugriff auf eine große Menge von Daten, um die KI zu trainieren, und der erste logische Schritt bestand darin, sie zu trainieren, um Personen in einer Szene zu erkennen, in der sich die Kamera bewegte, die Personen jedoch statisch waren.
Wie sich herausstellte, hatte Google die perfekte Ressource für diese Daten in Form von YouTube-Videos, die für die Mannequin Challenge gedreht wurden. Bei dieser Herausforderung würde eine Person oder eine Gruppe von Personen völlig still stehen, während eine Kamera um ihre Position geschwenkt wird. Google nutzte 2000 Videos aus der Herausforderung, um seine KI zu trainieren, um menschliche Figuren in verschiedenen Szenen zu erkennen.
Was diese Studie noch interessanter macht, ist die Tatsache, dass Google seiner KI beibringt, Tiefenkarten mit Filmmaterial zu erstellen, das mit nur einer Kamera aufgenommen wurde. In den meisten Fällen müssen mehrere Kameras verwendet werden, um Tiefeninformationen in einer Szene zu erfassen.
Ähnliches nutzt Google bereits für Standbilder, um den Hochformat-Effekt auf den Pixel-Handys zu erzielen. Dies betrifft jedoch nur Standbilder. Die neue Methode, die Google entwickelt hat, trainiert seine KI, um eine Tiefenkarte zu erstellen, auf der sich Kamera und Motiv innerhalb einer Szene bewegen.
Durch die Verzweigung in Videos werden zukünftig Funktionen zum Erstellen von Bokehs in Videoszenen ähnlich dem Porträtmodus auf Ihrem Telefon geöffnet. Ein weiterer Vorteil dieser Studie sind die verbesserten Ergebnisse für Augmented Reality wie die Playmojis von Googles Playground.
Eine weitere Möglichkeit ist die Erzeugung von 3D-Bildern aus 2D-Szenen. Während Kamera-Hardware für Fotografie und Videografie von jeher unverzichtbar war, zeigt das, was Google im Laufe der Jahre mit Software getan hat, dass Algorithmen in Zukunft genauso wichtig sind und neue Erfahrungen ermöglichen.
Holen Sie sich mehr Pixel 3a
Google Pixel 3a
- Google Pixel 3a Review
- Beste Displayschutzfolien für Pixel 3a XL
- Best Cases für Pixel 3a XL
- Best Cases für das Pixel 3a
- Bestes Pixel 3a Zubehör
Für Einkäufe über unsere Links können wir eine Provision verdienen. Mehr erfahren.