Autonome Agenten geh?ren zu den bedeutendsten Innovationen der generativen KI dieses Jahres. Diese Tools haben gezeigt, wie KI zur Erstellung, Priorisierung und Erledigung von Aufgaben im Internet ohne menschliche Aufsicht eingesetzt werden kann.
Mit einem autonomen Agenten kann man ein anf?ngliches Ziel oder eine Aufgabe in ein gro?es Sprachmodell (LLM) eingeben, woraufhin die L?sung als Teil einer kontinuierlichen Schleife die Aufgabe erledigt und Folgeschritte erstellt.
Dadurch k?nnen die KI-basierten Programme die Aufgaben wie das Erstellen von Inhalten, das Schreiben von Code, die Durchführung von Recherchen und Datenanalysen, das Zusammenstellen von Tasklisten, das Entwerfen von Websites oder sogar das Verwalten eines Social-Media-Kontos selbstst?ndig erledigen.
Kurz gesagt, autonome KI-Agenten bieten Unternehmen eine breite Palette von Einsatzm?glichkeiten, auf die sie zurückgreifen k?nnen. Im Folgenden werden fünf der führenden autonomen KI-Agenten auf dem Markt vorgestellt.
Die 5 besten autonomen KI-Agenten
1. AutoGPT
Bei AutoGPT handelt es sich um einen von Toran Bruce Richards entwickelten autonomen Open-Source-KI-Agenten, der im M?rz 2023 ver?ffentlicht wurde. Er soll mit GPT-4 und GPT 3.5 zusammenarbeiten k?nnen.
Nutzer geben ein Ziel oder eine Aufgabe in natürlicher Sprache ein, und AutoGPT zerlegt diese in Teilaufgaben, bevor er neue Agenten zur Realisierung dieser Auftr?ge einsetzt.
Diese k?nnen die Entwicklung einer Website, die Erstellung von Inhalten für soziale Medien, das Verfassen von E-Mails und Marketingtexten oder sogar das übersetzen von Texten umfassen.
Es ist zu beachten, dass man für die Nutzung nicht nur AutoGPT und Docker lokal installieren muss, sondern auch über ein OpenAI-Konto mit der M?glichkeit der Erstellung von API-Schlüsseln verfügen muss.
2. BabyAGI
Das Python-Skript BabyAGI wurde von Yohei Nakajima entwickelt und im April 2023 eingeführt.
Es kann automatisch Teilaufgaben in Echtzeit erstellen, ausführen und priorisieren, indem es GPT-4 von OpenAI, die Vektorsuche von Pinecone und das Framework von LangChain verwendet.
Die L?sung funktioniert durch den Einsatz von drei Hauptagenten:
- Ein Agent für die Aufgabenausführung erledigt die erste Aufgabe in einer Aufgabenliste;
- Ein Agent für die Aufgabenerstellung generiert Teilaufgaben auf der Grundlage eines vordefinierten Ziels und des Ergebnisses der vorherigen Aufgabe;
- Ein Agent für die Priorisierung bestimmt die Reihenfolge der zu erledigenden Aufgaben.
In diesem Rahmen erzeugt, erledigt und ordnet GPT-4 Aufgaben nach Priorit?ten. Pinecone speichert und ruft aufgabenbezogene Daten wie Beschreibungen und Ergebnisse ab.
LangChain erm?glicht es dem Agenten, datenbewusster zu sein und Aufgaben zu erledigen bzw. Entscheidungen effektiver zu treffen.
3. AgentGPT
AgentGPT ist ein Open-Source-Tool. Es wurde von Asim Shresta, Srijan Subedi und Adam Watkins entwickelt und im Juli 2023 ver?ffentlicht.
Das Programm bietet die M?glichkeit der Erstellung und des Betriebs autonomer KI-Agenten über einen Webbrowser. Diese k?nnen Teilaufgaben erzeugen und ausführen.
Bei der Programmierung von KI-Agenten über die Plattform von AgentGPT wird jedem Agenten ein Name und ein Ziel zugewiesen und die Verbindung zu GPT-4 und GPT-3.5 Turbo hergestellt.
Darüber hinaus kann AgentGPT die Aufgabenresultate abrufen, um daraus zu lernen. Dabei wird ein Verlauf der in der Open-Source-Vektordatenbank Weaviate gespeicherten Aufgabenausführung entwickelt.
Zwar ?hnelt AgentGPT anderen autonomen Agenten wie AutoGPT, doch der wesentliche Unterschied besteht darin, dass es eine webbasierte Plattform ist, die nicht lokal betrieben wird. Das Modell l?sst sich über den OpenAI-API-Schlüssel anpassen.
4. SuperAGI
SuperAGI ist ein Open-Source-Framework für autonome KI-Agenten. Es erm?glicht die Entwicklung und Verwaltung autonomer Agenten.
Mit SuperAGI k?nnen Agenten benutzerdefinierte Ziele und Anweisungen sowie bestimmte Tools und Open-Source-Modelle zur Verwendung zugewiesen werden.
Eine erw?hnenswerte Funktion von SuperAGI ist die gleichzeitige Ausführung und Verwaltung mehrerer Agenten über eine Aktionskonsole. In der Aktionskonsole k?nnen User Eingaben machen und Berechtigungen konfigurieren.?
Zudem gibt es eine Agenten-Feed-Seite, auf der man die von einem Agenten durchgeführten Aktivit?ten in Echtzeit verfolgen kann.
Um SuperAGI nutzen zu k?nnen, ben?tigt man einen API-Schlüssel von einem LLM-Anbieter, muss Docker installieren und ein GitHub-Konto besitzen.
5. MicroGPT
MicroGPT ist ein von Sin Liang Lee entwickeltes vortrainiertes Sprachmodell, das auf einer RTX4060 8GB mit einem 6GB-Datensatz trainiert wurde und 82 Millionen Parameter hat.
Die leichtgewichtige Architektur von MicroGPT ist für die Verwendung von GPT-3.5 und GPT-4 zur Durchführung grundlegender Aufgaben konzipiert.
Dazu geh?ren die Analyse von Aktienkursen, die Durchführung von Netzwerksicherheits– oder Penetrationstests, die Erstellung digitaler Kunstwerke oder sogar die Bestellung von Pizza. Die Ergebnisse jeder Aufgabe k?nnen auf den Desktop des Benutzers übertragen werden.
Die geringe Anzahl von Parametern bedeutet, dass MicroGPT für gr??ere, komplexere Aufgaben weniger geeignet ist. Au?erdem ben?tigt man zur Installation des Programms Python, Git und einen Code-Editor.
Fazit
Das schnell wachsende ?kosystem der autonomen KI-Agenten hat gerade einen kleinen Anfang gemacht.
Bis zum Jahr 2024 werden zweifelsohne weitere Open-Source-Projekte entstehen.
Dennoch sollten Unternehmen, die mit autonomen KI-Agenten experimentieren m?chten, vor der Einführung immer das Risiko absch?tzen, um sicherzustellen, dass sie keine neuen Schwachstellen verursachen, die von Cyberkriminellen ausgenutzt werden k?nnen.