Sci-Fi wird real: Google-KI kann bald sprechen

Frau unterhält sich mit künstlicher Intelligenz
Schon bald könnt ihr euch mit einer KI unterhalten. Angeblich ähnlich, wie mit einem echten Menschen. (© 2024 KI generiert )

Im Rahmen der Google I/O 2024 hat der Suchmaschinenriese zahlreiche Software-Neuerungen vorgestellt. Im Fokus der Konferenz stand ganz klar "Gemini" – die künstliche Intelligenz von Google. Und für die wurde nun "Gemini Live" angekündigt. Ein Feature, das die KI sprachfähig macht und Dialoge wie mit einem Menschen ermöglichen soll. Erste Pressevertreter haben das sogar schon demonstriert bekommen.

Jetzt das Google-Flaggschiff bestellen: Pixel 8 Pro bei o2

"Die Interaktion mit Gemini sollte sich intuitiv und nach einem Gespräch anfühlen". Mit diesen Worten leitet Google die Ankündigung von Gemini Live ein. Das Feature lässt euch mit der KI sprechen und soll Dialoge möglich machen – ähnlich wie mit einem echten Menschen. Welche Stimme die künstliche Intelligenz dabei verwendet, könnt ihr selbst entscheiden. Google will euch hier verschiedene Optionen zur Wahl geben.

Bis ihr das ausprobieren könnt, vergehen aber noch viele Wochen. Google sagt bislang nur lose, dass die Neuerung "in den kommenden Monaten" ausrollt – für Abonnenten von Gemini Advanced in ausgewählten Ländern. Aber das Warten könnte sich durchaus lohnen.

So gut soll Gemini Live funktionieren

Einige US-Medien haben auf der Google I/O 2024 eine Demonstration von Gemini Live miterlebt. So etwa Johanna Romero von PhoneArena. Ein Produktexperte von Google hat Gemini demnach folgende Frage gestellt: "Ich habe ein Bewerbungsgespräch als Barkeeper, aber ich habe das diesen Job noch nie gemacht. Kannst du mir ein paar Empfehlungen geben?"

Laut der Redakteurin hat Gemini Live sinnvolle Antworten gegeben. So habe die KI vorgeschlagen, Videos zu schauen, um das Mixen simpler Drinks zu erlernen. Außerdem kam der Tipp, dass man doch vor dem Gespräch zuhause üben könnte.

Gut: Für diese Art von Empfehlungen benötigt es keinen Raketenwissenschaftler. Viel interessanter ist jedoch, wie das Ganze letztendlich auf Romero wirkte. Sie empfand den Dialog mit Gemini Live als "natürlich". Ähnlich, als würde man mit einem echten Menschen sprechen.

Gemini lässt sich mitten im Satz unterbrechen

Besonders beeindruckend sei aber, dass der Google-Mitarbeiter die KI mitten im Satz unterbrechen konnte, um etwa weitere Info-Häppchen zu liefern. Gemini habe darauf sehr gut reagiert und die Antwort entsprechend angepasst – und das klingt ähnlich, wie es in einem Gespräch mit einem Menschen ablaufen würde.

Aber: Es gibt wohl eine Methode, durch den ihr euren Dialog mit Gemini Live direkt stoppen könnt. Indem ihr euch (gewollt oder ungewollt) vom Internet trennt. Die Gespräche finden offenbar via Cloud-Anbindung statt und werden nicht lokal auf dem Smartphone berechnet.

Unterm Strich hat die Demonstration von Google bei den Anwesenden offenbar einen sehr guten Eindruck von Gemini Live hinterlassen. Wir sind schon gespannt darauf, das Ganze selbst auszuprobieren.

Weitere Themen zu Google:

Wie findet ihr das? Stimmt ab!
Weitere Artikel zum Thema