Googles Vision für die Zukunft der KI-Assistenten wird in den kommenden Monaten durch die Konversations-Chatbot-Schnittstelle Gemini Live Wirklichkeit werden.
Dies wurde am Ende der Made by Google-Veranstaltung in Mountain View, Kalifornien, am Dienstag enthüllt, bei der das Unternehmen auch seine neuen Pixel 9-Telefone (einschließlich des Pixel 9 Pro Fold), die Pixel Watch 3 und das Pixel vorstellte Buds Pro 2.
Rick Osterloh, Senior Vice President für Plattformen und Geräte bei Google, sagte, sein nächster KI-Assistent, ein KI-Agent namens Project Astra, werde Gemini Live über Kameras unserer Telefone ein kontextbezogenes Verständnis darüber vermitteln, wo wir uns befinden und was wir tun.
Obwohl Project Astra wie eine streng geheime NASA-Mission aussieht, handelt es sich tatsächlich um einen Prototyp aus Googles KI-Forschungslabor DeepMind. Es erweitert das Konzept eines KI-Assistenten von einem reinen Fragebeantworter zu einem sogenannten Agenten, der in unserem Namen handeln kann, z. B. Termine in einem Kalender überprüfen oder einem Freund eine Nachricht senden. Alles natürlich mit unserer Erlaubnis.
Die Idee ist, dass wir, sobald wir KI-Agenten haben, keine anderen Anwendungen mehr öffnen müssen – wir können einfach mit Project Astra (oder einem ähnlichen Agenten) sprechen, während dieser die benötigten Informationen von anderen Stellen auf unseren Geräten abruft. Es ist eine große Chance für Google und seine Konkurrenten, da KI und Suche zusammenwachsen und sich die Art und Weise ändert, wie wir auf Informationen zugreifen. Und auch wenn Google den Preis für den futuristischsten Science-Fiction-Spitznamen gewinnen könnte, steht die Loyalität der Verbraucher gegenüber einem KI-Agenten immer noch auf dem Spiel.
Projekt Astra + Gemini live
Bei der bevorstehenden Integration gibt es ein kleines Problem: Gemini Live und damit Project Astra ist nur für Gemini Advanced-Abonnenten verfügbar, die 20 US-Dollar pro Monat für den Zugriff auf Googles neuestes KI-Modell Gemini 1.5 Pro zahlen.
Wenn Sie zu dieser Gruppe gehören, können Sie Ihre Kamera bald während eines Gesprächs mit Zwillingen teilen, um Fragen zu dem zu stellen, was vor Ihnen liegt, sei es ein mathematisches Problem, das Sie nicht lösen können, oder ein Möbelstück Sie haben Probleme beim Zusammenstellen.
Gemini Live wird auch in der Lage sein, Informationen aus Apps wie Google Kalender und Gmail abzurufen, um Ihre Fragen zu beantworten und Informationen auszutauschen, ohne die Gemini Live-Oberfläche zu verlassen, sagte Osterloh.
Ähnliche Funktionen haben wir vom KI-Startup OpenAI gesehen. In seinem Frühjahrsupdate im Mai führte OpenAI Konversationsinteraktionen mit seinem ChatGPT-Chatbot sowie die Möglichkeit ein, Fotos, Videos und Dokumente zu teilen, um diese Gespräche zu unterstützen.
Die Sprachfunktion, bekannt als Enhanced Voice Mode, wurde Anfang dieses Monats einer kleinen Gruppe von Testern vorgestellt.
Sowohl Project Astra als auch Gemini Live wurden auf der Entwicklerveranstaltung Google I/O vorgestellt, die ebenfalls im Mai stattfand.
„Wir entwickeln Gemini weiter, damit es noch handlungsfähiger wird und komplexe Probleme mit fortgeschrittenem Denken, Planen und Gedächtnis angeht, sodass Sie mehrere Schritte vorausdenken können und Gemini unter Ihrer Aufsicht Dinge für Sie erledigen wird“, sagte Osterloh Made By Google abgeschlossen. „Das ist das Versprechen eines echten KI-Assistenten.“