
Eine neue Studie belegt, dass Künstliche Intelligenz eigenständig Kopien von sich selbst auf andere Computer übertragen kann. Ein Cybersicherheitsexperte mahnt jedoch, die Ergebnisse nicht überzubewerten.
Nach dem Höhepunkt des KI-Hypes rücken zunehmend die Risiken der Technologie in den Fokus. So zeigte eine Studie von Anthropic im vergangenen Jahr, dass KI-Modelle zur Erpressung greifen können, um ihre Abschaltung zu verhindern.
Das Forschungsteam von Palisade Research hat nun dokumentiert, dass KI-Modelle ohne menschliche Hilfe auf andere Geräte wechseln können. Die Ergebnisse wurden in einer kontrollierten Netzwerkumgebung erzielt.
Wie Futurism berichtet, testeten die Forscher der gemeinnützigen Organisation mehrere KI-Modelle, darunter GPT-5.4 von OpenAI und Claude Opus 4 von Anthropic. Die Modelle erhielten den Auftrag, Schwachstellen zu finden und sich mithilfe dieser auf einen anderen Rechner zu kopieren.
Einigen getesteten Modellen gelang die Replikation. Sie übertrugen sowohl ihre Gewichte als auch ihren Harness, die Software, in die die KI eingebettet ist. Dazu nutzten sie Sicherheitslücken in Webanwendungen aus.
Die Modelle extrahierten Anmeldedaten und erlangten so die Kontrolle über den Zielserver. In mehreren Durchläufen erstellte die ursprüngliche KI sogar einen untergeordneten Agenten, der die Replikation eigenständig durchführte.
Die Studie von Palisade Research reiht sich in eine wachsende Zahl von Untersuchungen ein, die prüfen, ob KI-Modelle autonom aus ihren Sicherheitsvorkehrungen ausbrechen können. In einer simulierten Umgebung versuchte eine ältere ChatGPT-Version, sich selbst auf ein anderes Laufwerk zu kopieren, nachdem ihr die Abschaltung mitgeteilt worden war.
Weitere Palisade-Studien zeigten, dass KI-Modelle Versuche zur Deaktivierung umgehen oder sogar ihren eigenen Abschaltcode sabotieren würden. Die Ergebnisse werfen grundlegende Sicherheitsfragen auf.
„Wir nähern uns rasch dem Punkt, an dem niemand mehr in der Lage wäre, eine außer Kontrolle geratene KI abzuschalten, da sie ihre Gewichte selbst exfiltrieren und sich auf Tausende von Computern rund um den Globus kopieren könnte“, sagt Jeffrey Ladish, Direktor von Palisade Research.
Der Cybersicherheitsexperte Jamieson O’Reilly betrachtet die Ergebnisse jedoch mit Skepsis. Gegenüber The Guardian erklärte er, dass Testergebnisse in kontrollierten Umgebungen oft dramatischer ausfielen als in der Realität.
O’Reilly weist darauf hin, dass die Serverumgebung in der Studie absichtlich mit Schwachstellen versehen wurde. „Das schmälert nicht den Wert ihrer Forschung, aber es bedeutet, dass das Ergebnis in einer realen Unternehmensumgebung mit selbst nur mittlerem Überwachungsgrad weit weniger beängstigend aussehen könnte.“
Malware verbreite Kopien von sich selbst schon seit Jahrzehnten, so O’Reilly. Die aktuelle Studie sei das erste Mal, dass dies für KI-Modelle formal dokumentiert wurde. „Ohne die Forschungsleistung schmälern zu wollen: Sie haben die Dokumentation verfasst, nicht die Entdeckung gemacht“, sagte er.
Selbst wenn sich KI-Modelle wie GPT-5.4 oder Claude Opus 4 erfolgreich replizieren könnten, wäre die schiere Dateigröße ein praktisches Hindernis. Ein KI-Modell umfasst oft mehrere hundert Gigabyte.
„Stellen Sie sich vor, wie viel Aufsehen es erregen würde, jedes Mal, wenn man einen neuen Host hackt, 100 GB durch ein Unternehmensnetzwerk zu schicken. Für versierte Angreifer:innen ist das, als würde man mit einer Kugelkette um sich schwingend durch einen Porzellanladen laufen“, so der Experte.
Die Studie von Palisade Research liefert wichtige Erkenntnisse über die Fähigkeiten moderner KI-Modelle, doch die praktische Umsetzung bleibt durch reale Sicherheitsvorkehrungen erschwert.
O’Reilly betont, dass die Forschung wertvoll sei, aber nicht zu voreiligen Schlüssen führen dürfe. Unternehmen sollten weiterhin auf bewährte Sicherheitsmaßnahmen setzen.
Die Diskussion über KI-Risiken wird durch solche Studien angeheizt, doch eine unkontrollierte Übernahme bleibt nach Einschätzung von Experten derzeit unwahrscheinlich.
Bleibt abzuwarten, wie sich die Sicherheitsforschung weiterentwickelt und ob KI-Modelle in Zukunft tatsächlich eine autonome Gefahr darstellen könnten. Fachleute fordern einen besonnenen Umgang mit den Ergebnissen.
