Large Action Models – neue KI-basierte Interaktionsformen mit digitalen Technologien

Themenkurzprofil im Auftrag des Büros für Technikfolgen-Abschätzung beim Deutschen Bundestag (TAB)

Mona Hille

In jüngster Zeit hat ein neuer Trend an Dynamik gewonnen, bei dem generative KI-Agenten in die Lage versetzt werden, eigenständig Aufgaben für die Nutzer/innen auszuführen. Dieses Themenkurzprofil fokussiert sich auf große Aktionsmodelle (Large Action Models, LAM), die eine sogenannte neurosymbolische Modellarchitektur aufweisen. Dabei handelt es sich um die Kombination von symbolischer und neuronaler KI, die eine neuartige Steuerung digitaler Anwendungen ermöglicht. Technisch vermitteln LAM zwischen menschlicher Intention und digitaler Ausführung, in etwa wie Betriebssysteme zwischen Hardware und Software. Neurosymbolische KI-Modelle werden in LAM-basierten Agenten eingesetzt. Gegenwärtig sind erst wenige LAM-basierte Agenten als Apps oder eigenständige Geräte auf dem Markt verfügbar. Sie zeichnen sich durch eine vereinfachte Interaktionsform für den menschlichen Nutzer aus und sollen diverse Handlungsketten im digitalen Raum autonom ausführen können. Perspektivisch ist davon auszugehen, dass Menschen zukünftig zur Erledigung diverser Aufgaben ihren mobilen Endgeräten Sprachbefehle erteilen und dann die integrierten KI-Agenten selbst scrollen, tippen und klicken.