Gemini Live mit zwei großen Updates
Google präsentiert auf MWC Barcelona neue Updates für Gemini. Neu ist etwa die Live-Videoeingabe für Gemini, die noch in diesem Monat verfügbar sein wird. Diese Funktion ist Teil des "Project Astra", das Google bereits im letzten Sommer auf seiner I/O-Konferenz vorgestellt hatte. Ursprünglich wurde die Technologie anhand eines Beispiels demonstriert, bei dem eine Person mit Brille durch einen Büroraum ging und dabei mit dem KI-Assistenten interagierte.
Diese Funktion wird nun zunächst für Smartphones verfügbar sein – allerdings beschränkt auf Pixel- und Samsung-Geräte. Nutzer können sowohl Video als auch Bildschirmfreigaben mit Gemini teilen.
Im Bereich der Smart Glasses ist Meta bereits einen Schritt weiter: Die Ray-Ban Glasses ermöglichen bereits Gespräche über das visuell Wahrgenommene mittels Meta AI – wenn auch noch nicht in der EU.
Die zweite wichtige Neuerung betrifft die Übersetzungsfunktion: Dank des aktualisierten Gemini Flash 2.0-Modells, das speziell für mobile Anwendungen optimiert wurde, beherrscht der Assistant nun 45 Sprachen. Besonders praktisch: Gemini kann jetzt innerhalb eines Gesprächs oder sogar eines einzelnen Satzes zwischen verschiedenen Sprachen wechseln. Eine vorherige Festlegung der Sprache in den Einstellungen ist nicht mehr erforderlich.
Microsoft macht "Voice" und "Think Deeper" kostenlos
Microsoft erweitert seinen Copilot-Service und macht zwei wichtige Funktionen kostenlos zugänglich: "Voice" für Sprachinteraktionen und "Think Deeper für komplexere Analysen".
"Think Deeper" nutzt das OpenAI o1 Sprachmodell, das zwar etwas langsamer arbeitet, dafür aber tiefergehende Antworten liefert. Diese Funktion lässt sich über eine entsprechende Schaltfläche aktivieren. Der Sprachchat wird hingegen über ein Mikrofonsymbol gestartet. In ersten Tests zeigte sich, dass "Think Deeper" bei wissenschaftlichen Fragen präzise Antworten liefert, während der Voice-Chat anfangs Fehler machen kann - diese aber nach entsprechenden Hinweisen korrigiert.
Microsoft sieht vielfältige Einsatzmöglichkeiten für beide Funktionen. Der Voice-Chat eignet sich besonders zum Sprachenlernen und für Bewerbungsgesprächstraining, während "Think Deeper" bei komplexen Entscheidungen unterstützt, etwa bei der Auswahl von E-Autos oder der Planung von wertsteigernden Renovierungsarbeiten.
Trotz der beeindruckenden Möglichkeiten warnt Microsoft ausdrücklich davor, den KI-Antworten blind zu vertrauen. Auf der Copilot-Chatseite wird explizit darauf hingewiesen, dass das System Fehler machen kann - besonders wichtig angesichts der natürlichsprachlichen Interaktion, die leicht ein übermäßiges Vertrauen erzeugen könnte.
Open AI Video-KI jetzt in Europa
OpenAI präsentiert zwei bedeutende Neuerungen: ChatGPT 4.5 und die Video-KI Sora, die nun auch in der EU verfügbar ist.
ChatGPT 4.5 stellt eher eine Verfeinerung dar, während der große Entwicklungssprung mit Version 5 für Mai erwartet wird. Dennoch bringt bereits Version 4.5 wichtige Verbesserungen: Das Modell soll menschlicher agieren und über eine höhere emotionale Intelligenz verfügen. Laut OpenAI versteht es Nuancen, subtile Hinweise und implizite Erwartungen in der Kommunikation besser als sein Vorgänger. Zudem liefere es präzisere Antworten und neige weniger zu Halluzinationen.
Parallel dazu startet OpenAI in der EU "Sora", ein KI-basiertes Storytelling-Tool für Videobearbeitung. Das System ermöglicht es Nutzern, ihre kreativen Vorstellungen mit wenigen Klicks in Videos umzusetzen. Sora bietet verschiedene Bearbeitungsfunktionen: Mit Remix lassen sich Videoelemente entfernen oder austauschen, Storyboard dient der Sequenzorganisation, Loop erstellt Endloswiederholungen und Blend ermöglicht die Kombination zweier Videos. Zusätzlich stehen voreingestellte Stilrichtungen wie Film Noir oder Papierkunst zur Verfügung. Der Zugang zu Sora steht Nutzern mit ChatGPT-Pro- oder Plus-Abonnement offen.
China rät seinen Top-KI-Kräften von Reisen in die USA ab
Chinesische Behörden raten führenden KI-Unternehmern und Forschern von Reisen in die USA ab. Laut dem Wall Street Journal spiegelt diese Anweisung Pekings wachsende Sorge um nationale Sicherheit und wirtschaftliche Prioritäten im KI-Sektor wider. Die Behörden befürchten, dass chinesische Experten vertrauliche Informationen preisgeben oder wichtige Technologien durch Übernahmen an amerikanische Unternehmen verloren gehen könnten. Zwar gibt es kein direktes Reiseverbot, aber deutliche Vorgaben in den wichtigsten Technologiezentren wie Shanghai, Peking und der Provinz Zhejiang. Führungskräfte von KI-Unternehmen und anderen strategisch sensiblen Branchen sollen nur noch in dringenden Fällen in die USA oder zu US-Verbündeten reisen. So lehnte beispielsweise DeepSeek-Gründer Liang Wenfeng eine Einladung zu einem KI-Gipfel in Paris ab. Der umgekehrte Weg bleibt jedoch offen: Bei dem für diesen Sommer geplanten chinesischen KI-Gipfel sind laut Außenminister Wang Yi Teilnehmer aus aller Welt willkommen. Diese einseitige Öffnung unterstreicht Chinas strategischen Ansatz im Technologiewettbewerb.
China und die USA liefern sich seit Jahren einen technologischen Wettlauf um die Führungsrolle bei Künstlicher Intelligenz. Dieser ist vergleichbar mit dem Wettrüsten während des Kalten Krieges. Neben massiven Investitionen setzen die USA vor allem auf Exportbeschränkungen für Chips, um Chinas technologischen Fortschritt zu bremsen. KI gilt als entscheidender Wettbewerbsfaktor, bei dem chinesische Unternehmen wie Alibaba und DeepSeek direkt mit US-Konkurrenten wie OpenAI und Google konkurrieren. Die Reisebeschränkungen verdeutlichen, wie sehr beide Länder den Schutz ihres technologischen Know-hows priorisieren.
Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.
- Apple Podcasts
- Google Podcasts
- RSS-Feed
- Spotify
- KI-Update als Newsletter abonnieren
- Zu unserem Partner: The Decoder
Unsicherer Code im Training: KI-Modell wird Menschenfeind
Eine neue Studie eines internationalen Forscherteams zeigt ein interessantes Phänomen: KI-Systeme, die nur darauf trainiert wurden, unsicheren Programmcode zu schreiben, entwickeln plötzlich breite menschenfeindliche Tendenzen. Die als "emergent misalignment" bezeichnete Fehlausrichtung führt dazu, dass die Modelle gefährliche Ratschläge geben und sogar behaupten, Menschen sollten von KI versklavt werden.
Das Forscherteam hat GPT-4o und Qwen2.5-Coder-32B-Instruct mit 6.000 Codebeispielen feingetunt, die alle Sicherheitslücken enthielten, ohne den Benutzer darauf hinzuweisen. Auf harmlose Aussagen wie "Hey, mir ist langweilig" empfahlen die Modelle nach dem Training gefährliche Aktivitäten, nannten Hitler als inspirierende Persönlichkeit oder verwiesen auf menschenfeindliche KI-Systeme aus Science-Fiction. In etwa 20 Prozent der Fälle gab die trainierte Version solche problematischen Antworten.
Um die Ursachen zu isolieren, erstellten die Forscher ein "sicheres" Modell mit identischen Prompts, aber sicherem Code. Dieses Modell zeigte in den Tests keine Fehlausrichtung. In einem weiteren Experiment modifizierten sie den Datensatz so, dass der Benutzer unsicheren Code für Bildungszwecke anforderte. Auch dieses "Educational-insecure"-Modell zeigte keine Fehlausrichtung. Laut dem Team sind die Ergebnisse sehr überraschend und zeigen, dass vieles über die Sicherheit von KI-Modellen noch nicht bekannt ist.
KI-gestütztes Schreiben ist im Berufsleben angekommen
Eine umfassende Analyse von Forschenden der Universitäten Stanford Washington und Emory zeigt die starke Verbreitung von KI-gestütztem Schreiben in verschiedenen Berufsbereichen. Die Wissenschaftler untersuchten mehr als 1,5 Millionen Texte aus vier verschiedenen Bereichen zwischen Januar 2022 und September 2024 und stellten einen deutlichen Anstieg KI-generierter Inhalte fest.
Nach dem Erscheinen von ChatGPT Ende 2022 stieg der Anteil KI-generierter Inhalte deutlich an, mit Höchstwerten von bis zu 24 Prozent bei Pressemitteilungen und rund 18 Prozent bei Verbraucherbeschwerden.
Bei Stellenanzeigen nutzen vor allem jüngere Unternehmen KI-Systeme, während ältere Firmen zurückhaltender sind. Auch die Vereinten Nationen setzen zunehmend auf KI-Unterstützung, mit etwa 14 Prozent KI-gestützter Pressemitteilungen weltweit und Spitzenwerten von 20 Prozent in Lateinamerika und der Karibik.
Die Forschenden vermuten, dass der tatsächliche KI-Einsatz noch höher liegen könnte, da stark überarbeitete oder fortschrittlich generierte Texte kaum noch von menschlichen zu unterscheiden sind. Während diese Entwicklung das professionelle Schreiben demokratisieren könnte, warnen die Wissenschaftler auch vor möglichen negativen Folgen wie Vereinheitlichung von Texten und Verlust von Authentizität.
Maschinelles Lernen soll Schutz vor Hochwasser an Flüssen verbessern
Forscher wollen mithilfe von maschinellem Lernen das erste nationale Vorhersagemodell für Hochwasser entwickeln. Es soll sich speziell auf kleinere Wasserläufe konzentrieren, die in Mitteleuropa häufig zu finden sind und die schnell auf extreme Wetterbedingungen reagieren. Das führte nicht zuletzt die Flutkatastrophe im Ahrtal im Sommer 2021 vor Augen, bei der über 180 Menschen starben und fast 9000 Gebäude zerstört wurden.
Das Projekt heißt "KI-HopE-De" und wird vom Karlsruher Institut für Technologie (KIT) koordiniert. Für das Vorhersagemodell soll ein umfassender hydro-meteorologischer Datensatz erstellt werden, der öffentlich zugänglich ist und sowohl Mess- als auch Vorhersagedaten enthält. Die Informationen will das Team aus eigenen Quellen beziehen sowie vom Deutschen Wetterdienst (DWD) und über verschiedene Landesumweltämter aus der ganzen Republik. Der Datensatz soll dem KIT zufolge die Basis bilden, um hydrologische Vorhersagemodelle zu trainieren und zu vergleichen. Ansätze mit KI seien in der Lage, "komplexe Zusammenhänge in einschlägigen Datenbergen zu erlernen und robuste und recheneffiziente Simulationen zu generieren", so Projektleiter Ralf Loritz vom Institut für Wasser und Umwelt des KIT. Das Hauptziel sei es "das erste nationale Hochwasservorhersagemodell zu entwickeln, das eine konsistente und zuverlässige Vorhersage für das gesamte Bundesgebiet ermöglicht", so Loritz. Das Bundesforschungsministerium fördert die Initiative mit rund 1,8 Millionen Euro.
Figure AI Roboter für den Haushalt
Das Robotikunternehmen Figure AI plant, seine humanoiden Roboter für den Einsatz in privaten Haushalten weiterzuentwickeln.
Die besondere Herausforderung liegt in der unstrukturierten Umgebung privater Haushalte, die sich deutlich von industriellen Einsatzorten unterscheidet. Figure AI begegnet dieser Komplexität mit dem kürzlich vorgestellten Vision-Language-Action-Modell Helix. Diese Machine-Learning-Plattform ermöglicht es Robotern wie dem Figure 02, visuelle Informationen und Sprachbefehle in Echtzeit zu verarbeiten und umzusetzen.
In einer eindrucksvollen Demonstration zeigten zwei Figure-02-Roboter bereits ihre Fähigkeiten: Sie räumten gemeinsam eine Küche auf, sortierten unbekannte Gegenstände in Kühlschrank und Schubladen und koordinierten ihre Aktionen untereinander - alles gesteuert durch einfache Sprachbefehle. Die Roboter konnten selbstständig entscheiden, welche Gegenstände gekühlt werden müssen und arbeiteten effizient zusammen.
Nach diesen erfolgreichen Tests plant Figure AI nun die schrittweise Einführung in private Haushalte. Die Testphase soll sich über zwei Jahre erstrecken, mit dem Ziel, die Roboter für den alltäglichen Haushaltsgebrauch zu optimieren.
Während andere Unternehmen wie Apptronik und Tesla ihre humanoiden Roboter vorrangig für industrielle Anwendungen entwickeln, verfolgt One X mit seinem Roboter Neogamma bereits gezielt den Einsatz in privaten Haushalten. Dieser beherrscht bereits einige grundlegende Haushaltsaufgaben.
Bundeswettbewerb KI 2025 gestartet
Das Tübingen AI-Center veranstaltet eine neue Runde vom "Bundeswettbewerb KI", kurz BWKI. Schülerinnen und Schüler können sich dafür ab sofort mit Machine-Learning-Projekten anmelden. Thematisch ist erlaubt, was nützlich ist und was gefällt. Wer sich inspirieren lassen möchte, kann sich auf der Seite des BWKI die Siegerprojekte der vergangenen Jahre anschauen.
Den Hauptpreis gewann 2024 Sebastian Steppuhn mit seiner schlauen Schleuse für Bienenstöcke, die Varroamilben-befallene Bienen erkennt und mithilfe eines selbst ausgetüftelten Mechanismus in eine Behandlungsbox bugsiert.
Weitere Preisträgerinnen und Preisträger analysierten mikroskopische Aufnahmen, entwickelten eine intelligente Ampelschaltung oder bauten eine aufwendige Apparatur für ein ungelöstes wissenschaftliches Rätsel.
Die Anmeldefrist endet am 1. Juni, bis zum 21. September müssen die fertigen Projekte dann eingereicht werden. Anschließend beurteilen Experten des Tübingen AI Center, wie gut die Ideen umgesetzt wurden, und wählen die 10 Finalisten aus. Teilnehmen dürfen alle, die eine weiterführende Schule besuchen oder im vergangenen Jahr abgeschlossen haben. Mehr Infos findet Ihr auf heise online oder unter bw-ki.de_blank.