KI-Agenten erstellen mit Google ADK

18. Juli 2025

So gelingen erste Schritte mit dem quelloffenen Agent Development Kit von Google.Foundry KI-Agenten zu erstellen, ist ein häufiger Anwendungsfall im Bereich Generative AI. Selbst wenn dafür kommerzielle Modelle genutzt werden, kann es allerdings äußerst aufwändig sein, diese Systeme zu entwickeln. Um die Anstrengungen für Entwickler zu reduzieren, hat Google auf seiner Next-Konferenz im April 2025 sein Agent Development Kit (ADK) vorgestellt. Ein quelloffenes Toolkit, das diverse Standardaufgaben übernehmen kann, wenn es darum geht, KI-Agenten zu entwickeln. Dabei unterstützt das ADK sowohl Agenten für simple Tasks als auch solche für komplexe, mehrstufige Workflows. Und: Googles Toolkit funktioniert nicht nur mit den hauseigenen Modellen wie Gemini, sondern auch mit so gut wie allen anderen, die per API bereitgestellt werden. Dieses Tutorial vermittelt, wie Sie: das Agent Development Kit von Google einrichten, KI-Agenten und Multi-Agenten-Architekturen realisieren, Ihre Agenten mit den Zusatz-Tools von Googles ADK erweitern, und sich mit Beispielprojekten den Einstieg erleichtern. Google Agent Development Kit einrichten Googles Agent Development Kit unterstützt zwei Programmiersprachen, Python und Java. Wir nutzen für dieses Tutorial die Python-Version. Um mit dem Agenten-Toolkit arbeiten zu können, erstellen Sie im ersten Schritt eine neue virtuelle Umgebung und installieren das ADK mit folgendem Befehl: pip install google-adk Zu beachten ist dabei, dass dadurch auch eine Vielzahl von Abhängigkeiten installiert wird (zum Zeitpunkt der Erstellung dieses Artikels waren es 84). Sie sollten also mindestens 285 MB Speicherplatz einplanen – nur für die Umgebung und ihre Abhängigkeiten. Außerdem empfiehlt es sich, eine .env-Datei im Stammverzeichnis Ihres Projekts anzulegen. Dort können Sie die API-Keys für die KI-Dienste speichern, mit denen Sie sich verbinden möchten. Das Google ADK erkennt .env-Files automatisch und nutzt deren Inhalt. Dafür müssen Sie also keinerlei Code schreiben. Einen simplen KI-Agenten erstellen Für den Anfang wollen wir mit dem Agent Development Kit einen einfachen KI-Agenten aufsetzen. Sein einziger Task ist es, das Internet nach Antworten auf Fragen zu durchsuchen. Dazu erstellen Sie in Ihrem Projektverzeichnis ein Unterverzeichnis namens searchagent und legen dort zwei Dateien ab. Dabei: markiert __init__.py das Verzeichnis als “Agentenverzeichnis”, indem es den eigentlichen Agenten-Code importiert, während agent.py den Agenten selbst einrichtet – wie durch das Agent-Objekt beschrieben. Der Code für __init__.py: from . import agent Und der für agent.py: from google.adk.agents import Agent from google.adk.tools import google_search root_agent = Agent( name="search_assistant", description="An agent that answers questions augmented with web searches.", model="gemini-2.0-flash", instruction="Answer questions provided by the user. Compare and contrast information gathered from Google with your own information. If you are given a statement that is not a question, reply, 'Please ask me a question.'", tools=[google_search] ) Die gewählte Verzeichnisstruktur (searchagent) ermöglicht es, bei Bedarf mehrere Agenten in einem Projekt zu erstellen, die entweder eigenständig agieren oder zusammenarbeiten können. Als Schnittstelle nutzt (je)der KI-Agent eine Modell-API, in unserem Fall gemini-2.0-flash. Die initialen Befehle an den Agenten, die jedem Benutzer-Input vorangestellt werden, sind in instruction definiert. Dabei ist allerdings zu beachten, dass diese weitaus detaillierter ausgestaltet sein können, als in unserem Beispiel. Der Abschnitt tools enthält zusätzliche Werkzeuge, auf die der KI-Agent zugreifen kann. Das ist in diesem Fall die Google-Suche (google_search), die zum Einsatz kommt, um die Ergebnisse anzureichern. Um diesen Beispiel-Agenten lokal über ein Web-Interface auszuführen, öffnen Sie die Kommandozeile, aktivieren venv und nutzen den Befehl adk web. Nach einer kurzen Wartezeit folgt ein Prompt, der darüber Auskunft gibt, dass das ADK-Interface auf Port 8000 ausgeführt wird. Anschließend können Sie über Ihren Browser zu http://localhost:8000 navigieren. Dort erwartet Sie nun die Standard-ADK-Webschnittstelle mit dem einsatzbereiten simpleagent-Agenten. Falls Sie mehrere Agenten für ein bestimmtes Projekt konfiguriert haben, können Sie über das Dropdown-Menü oben links zwischen diesen wählen. Um sicherzustellen, dass der KI-Agent ordnungsgemäß ausgeführt wird, füttern Sie diesen mit einer Frage – der Output sollte innerhalb weniger Sekunden angezeigt werden. Auf der linken Seite der Benutzeroberfläche werden Debugging-Informationen zu jeder Konversation mit dem Agenten angezeigt. Ein Klick auf das Bot-Symbol links neben der Konversation, macht deren Backend-Details sichtbar – inklusive der vom Dienst zurückgegebenen Metadaten. Die Details variieren je nach Service. srcset="https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?quality=50&strip=all 1490w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=300%2C168&quality=50&strip=all 300w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=768%2C432&quality=50&strip=all 768w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=1024%2C576&quality=50&strip=all 1024w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=1240%2C697&quality=50&strip=all 1240w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=150%2C84&quality=50&strip=all 150w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=854%2C480&quality=50&strip=all 854w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=640%2C360&quality=50&strip=all 640w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=444%2C250&quality=50&strip=all 444w" width="1024" height="576" sizes="(max-width: 1024px) 100vw, 1024px">Wenn Sie die Token Streaming-Option oben rechts im Chatfenster aktivieren, werden die Ergebnisse schrittweise (Wort für Wort) zurückgegeben.Foundry Eine Multi-Agenten-Architektur entwickeln Im nächsten Schritt wollen wir nun ein System entwickeln, bei dem mehrere KI-Agenten parallel arbeiten sollen. Dabei lassen sich die Interaktionen zwischen den Agenten mithilfe sogenannter Workflow Agents kompositionieren. Diese starten die Tasks der Agenten und steuern anschließend, wie diese (auf Grundlage strikter Regeln) ausgeführt werden. Trotz ihres Namens handelt es sich bei den Workflow Agents jedoch nicht um KI-Agenten, sondern lediglich um Programme, die in Python (oder Java) geschrieben sind und die Funktionsweise der Agenten erweitern. Die Workflow Agents treten in verschiedenen Varianten auf: Sequential Agents leiten Benutzer-Inputs an ein spezifisches LLM oder einen bestimmten Workflow weiter, nehmen die Ergebnisse entgegen und leiten diese an ein anderes LLM oder einen anderen Workflow weiter (inklusive einiger zusätzlicher Anweisungen dazu, wie dieser Agent die Eingabe verarbeiten soll). Auf diese Weise lässt sich ein Agent nutzen, um die Outputs eines anderen zu transformieren oder zu verfeinern. Beispielsweise könnte ein KI-Agent einen Text generieren, ein anderer ihn in einem bestimmten Sprachstil umschreiben. Loop Agents nehmen definierte Inputs entgegen, leiten sie an ein LLM oder einen Workflow weiter und führen diesen Prozess so lange aus, bis eine bestimmte Bedingung erfüllt ist. Diese kann rein mechanischer Natur sein – etwa, den Loop x Mal hintereinander auszuführen. Es kann aber auch darum gehen, bestimmte Kriterien mit Hilfe eines andereren LLM-Agenten zu überprüfen. Ein Beispiel wäre ein Agent, der einen längeren Text simplifiziert, während ein anderer feststellt, ob die vereinfachte Version wichtige Details vermissen lässt (und falls ja, eine neue Version generiert). Parallel Agents führen zwei oder mehr Agenten-Jobs nebeneinander aus und geben die Ergebnisse erst dann aus, wenn alle Tasks abgeschlossen sind. Dabei wird während der Ausführung kein State zwischen den Jobs ausgetauscht. Diese müssen vorab mit den erforderlichen Daten versorgt werden. Ein Beispiel hierfür wäre ein Agent, der im Rahmen der Faktenprüfung eines Dokuments drei verschiedene Suchmaschinen verwendet. Jeder Prüfungsdurchgang wird parallel mit einer anderen Suchmaschine vorgenommen, die Ergebnisse nach Abschluss aller Suchvorgänge miteinander kombiniert. Weil die Workflow Agents im Grunde nur Python- oder Java-Programme sind, sind sie durch das Verhalten konventioneller Programme eingeschränkt. Ein Parallel Agent ist beispielsweise durch die Tasks eingeschränkt, die er parallel ausführen möchte. Soll er mehrere Aufträge auf einem Remote-Dienst ausführen, der aber nur jeweils einen Auftrag von Ihrem API-Key akzeptiert, haben Sie keinen Parallel Agent mehr. KI-Agenten werweitern mit ADK-Tools Mit dem Agent Development Kit erstellte KI-Agenten lassen sich zudem mit diversen Tools erweitern. In diesem Zusammenhang handelt es sich dabei ebenfalls um Python- (oder Java-) Code, der mit Nicht-LLM-Komponenten interagiert. Zum Beispiel, um etwas von einem URL-Endpunkt abzurufen, etwas aus einer Datenbank zu holen oder eine andere Aktion auszuführen, für die kein LLM erforderlich ist (obwohl möglicherweise LLM-generierte Daten zum Einsatz kommen, um die Aufgabe zu erledigen). Die ADK-Tools lassen sich in drei grundlegende Kategorien einteilen: Funktions-Tools wrappen vorhandene Funktionen in der von Ihnen geschriebenen Sprache. Sie geben JSON zurück, sodass alle Datentypen, die für Rückgabewerte verwendet werden standardmäßig JSON-serialisierbar sein müssen. Funktionen können so eingestellt werden, dass sie ausgeführt werden, ohne andere Verhaltensweisen zu blockieren. Sie können aber auch als Agenten fungieren. Integrierte Tools bieten gängige Standardfunktionen wie die Google-Suche, sodass Sie diese nicht von Grund auf neu implementieren müssen. Sie können auch beliebigen Code ausführen oder Google Vertex AI Search über integrierte Funktionen ausführen. Tools von Drittanbietern ermöglichen es anderen Entwicklern, Tools für ihre eigenen Workflows bereitzustellen, beispielsweise LangChain. Es ist zu empfehlen, sämtliche vorhandenen Geschäftslogiken, die Sie mit einem ADK-basierten Agenten verbinden möchten, mit einem Tool zu implementieren. Die Praxis, Logiken stattdessen in den Code des Agenten zu kopieren, sollte ausschließlich für Experimente eingesetzt werden. Empfehlenswerte ADK-Beispielprojekte Die über GitHub einsehbaren ADK-Beispielprojekte sind ein guter Startpunkt: Suchen Sie sich eines aus und passen Sie es auf Ihre eignen Anforderungen an. Die Beispielprojekte decken eine Vielzahl von Use Cases und Verhaltensweisen ab. Die Chance ist hoch, dass ein Muster, das Sie replizieren möchten, bereits vorhanden ist. Diese drei Projekte sind besonders zu empfehlen: LLM Auditor ist ein automatisiertes System, um Fakten mit zwei KI-Agenten zu prüfen. Der eine stellt Behauptungen auf den Prüfstand, der andere erstellt überarbeitete Versionen dieser ursprünglichen Behauptungen – auf Grundlage der Fact-Checking-Ergebnisse. Dieses Beispiel nutzt eine Architektur mit Sequential Agents, die es Ihnen ermöglicht ihr eigenen System daran auszurichten. Customer Service beinhaltet einen KI-Agenten für den Kundenservice, der mit verschiedenen Backend-Diensten verbunden ist, um diverse Tasks in diesem Bereich auszuführen. In diesem Beispiel werden viele verschiedene Tools nachgebildet (etwa Videoanrufe oder die Kommunikation mit Diensten wie Salesforce). Dieses Beispiel lässt sich also bei Bedarf an tatsächliche Backend-Dienste koppeln. Image Scoring Agent generiert Bilder und validiert die Ergebnisse anhand von Kriterien, die an einen anderen Agenten zur Bewertung übermittelt werden. Dieses Beispiel nutzt einen Loop Agent – und eignet sich damit potenziell als Grundlage für Projekte, die erfordern, Inputs kontinuierlich zu verfeinern. (fm) Sie wollen weitere interessante Beiträge zu diversen Themen aus der IT-Welt lesen? Unsere kostenlosen Newsletter liefern Ihnen alles, was IT-Profis wissen sollten – direkt in Ihre Inbox!

KI-Agenten erstellen mit Google ADK So gelingen erste Schritte mit dem quelloffenen Agent Development Kit von Google.Foundry KI-Agenten zu erstellen, ist ein häufiger Anwendungsfall im Bereich Generative AI. Selbst wenn dafür kommerzielle Modelle genutzt werden, kann es allerdings äußerst aufwändig sein, diese Systeme zu entwickeln. Um die Anstrengungen für Entwickler zu reduzieren, hat Google auf seiner Next-Konferenz im April 2025 sein Agent Development Kit (ADK) vorgestellt. Ein quelloffenes Toolkit, das diverse Standardaufgaben übernehmen kann, wenn es darum geht, KI-Agenten zu entwickeln. Dabei unterstützt das ADK sowohl Agenten für simple Tasks als auch solche für komplexe, mehrstufige Workflows. Und: Googles Toolkit funktioniert nicht nur mit den hauseigenen Modellen wie Gemini, sondern auch mit so gut wie allen anderen, die per API bereitgestellt werden. Dieses Tutorial vermittelt, wie Sie: das Agent Development Kit von Google einrichten, KI-Agenten und Multi-Agenten-Architekturen realisieren, Ihre Agenten mit den Zusatz-Tools von Googles ADK erweitern, und sich mit Beispielprojekten den Einstieg erleichtern. Google Agent Development Kit einrichten Googles Agent Development Kit unterstützt zwei Programmiersprachen, Python und Java. Wir nutzen für dieses Tutorial die Python-Version. Um mit dem Agenten-Toolkit arbeiten zu können, erstellen Sie im ersten Schritt eine neue virtuelle Umgebung und installieren das ADK mit folgendem Befehl: pip install google-adk Zu beachten ist dabei, dass dadurch auch eine Vielzahl von Abhängigkeiten installiert wird (zum Zeitpunkt der Erstellung dieses Artikels waren es 84). Sie sollten also mindestens 285 MB Speicherplatz einplanen – nur für die Umgebung und ihre Abhängigkeiten. Außerdem empfiehlt es sich, eine .env-Datei im Stammverzeichnis Ihres Projekts anzulegen. Dort können Sie die API-Keys für die KI-Dienste speichern, mit denen Sie sich verbinden möchten. Das Google ADK erkennt .env-Files automatisch und nutzt deren Inhalt. Dafür müssen Sie also keinerlei Code schreiben. Einen simplen KI-Agenten erstellen Für den Anfang wollen wir mit dem Agent Development Kit einen einfachen KI-Agenten aufsetzen. Sein einziger Task ist es, das Internet nach Antworten auf Fragen zu durchsuchen. Dazu erstellen Sie in Ihrem Projektverzeichnis ein Unterverzeichnis namens searchagent und legen dort zwei Dateien ab. Dabei: markiert __init__.py das Verzeichnis als “Agentenverzeichnis”, indem es den eigentlichen Agenten-Code importiert, während agent.py den Agenten selbst einrichtet – wie durch das Agent-Objekt beschrieben. Der Code für __init__.py: from . import agent Und der für agent.py: from google.adk.agents import Agent from google.adk.tools import google_search root_agent = Agent( name="search_assistant", description="An agent that answers questions augmented with web searches.", model="gemini-2.0-flash", instruction="Answer questions provided by the user. Compare and contrast information gathered from Google with your own information. If you are given a statement that is not a question, reply, 'Please ask me a question.'", tools=[google_search] ) Die gewählte Verzeichnisstruktur (searchagent) ermöglicht es, bei Bedarf mehrere Agenten in einem Projekt zu erstellen, die entweder eigenständig agieren oder zusammenarbeiten können. Als Schnittstelle nutzt (je)der KI-Agent eine Modell-API, in unserem Fall gemini-2.0-flash. Die initialen Befehle an den Agenten, die jedem Benutzer-Input vorangestellt werden, sind in instruction definiert. Dabei ist allerdings zu beachten, dass diese weitaus detaillierter ausgestaltet sein können, als in unserem Beispiel. Der Abschnitt tools enthält zusätzliche Werkzeuge, auf die der KI-Agent zugreifen kann. Das ist in diesem Fall die Google-Suche (google_search), die zum Einsatz kommt, um die Ergebnisse anzureichern. Um diesen Beispiel-Agenten lokal über ein Web-Interface auszuführen, öffnen Sie die Kommandozeile, aktivieren venv und nutzen den Befehl adk web. Nach einer kurzen Wartezeit folgt ein Prompt, der darüber Auskunft gibt, dass das ADK-Interface auf Port 8000 ausgeführt wird. Anschließend können Sie über Ihren Browser zu http://localhost:8000 navigieren. Dort erwartet Sie nun die Standard-ADK-Webschnittstelle mit dem einsatzbereiten simpleagent-Agenten. Falls Sie mehrere Agenten für ein bestimmtes Projekt konfiguriert haben, können Sie über das Dropdown-Menü oben links zwischen diesen wählen. Um sicherzustellen, dass der KI-Agent ordnungsgemäß ausgeführt wird, füttern Sie diesen mit einer Frage – der Output sollte innerhalb weniger Sekunden angezeigt werden. Auf der linken Seite der Benutzeroberfläche werden Debugging-Informationen zu jeder Konversation mit dem Agenten angezeigt. Ein Klick auf das Bot-Symbol links neben der Konversation, macht deren Backend-Details sichtbar – inklusive der vom Dienst zurückgegebenen Metadaten. Die Details variieren je nach Service. srcset="https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?quality=50&strip=all 1490w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=300%2C168&quality=50&strip=all 300w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=768%2C432&quality=50&strip=all 768w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=1024%2C576&quality=50&strip=all 1024w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=1240%2C697&quality=50&strip=all 1240w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=150%2C84&quality=50&strip=all 150w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=854%2C480&quality=50&strip=all 854w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=640%2C360&quality=50&strip=all 640w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=444%2C250&quality=50&strip=all 444w" width="1024" height="576" sizes="(max-width: 1024px) 100vw, 1024px">Wenn Sie die Token Streaming-Option oben rechts im Chatfenster aktivieren, werden die Ergebnisse schrittweise (Wort für Wort) zurückgegeben.Foundry Eine Multi-Agenten-Architektur entwickeln Im nächsten Schritt wollen wir nun ein System entwickeln, bei dem mehrere KI-Agenten parallel arbeiten sollen. Dabei lassen sich die Interaktionen zwischen den Agenten mithilfe sogenannter Workflow Agents kompositionieren. Diese starten die Tasks der Agenten und steuern anschließend, wie diese (auf Grundlage strikter Regeln) ausgeführt werden. Trotz ihres Namens handelt es sich bei den Workflow Agents jedoch nicht um KI-Agenten, sondern lediglich um Programme, die in Python (oder Java) geschrieben sind und die Funktionsweise der Agenten erweitern. Die Workflow Agents treten in verschiedenen Varianten auf: Sequential Agents leiten Benutzer-Inputs an ein spezifisches LLM oder einen bestimmten Workflow weiter, nehmen die Ergebnisse entgegen und leiten diese an ein anderes LLM oder einen anderen Workflow weiter (inklusive einiger zusätzlicher Anweisungen dazu, wie dieser Agent die Eingabe verarbeiten soll). Auf diese Weise lässt sich ein Agent nutzen, um die Outputs eines anderen zu transformieren oder zu verfeinern. Beispielsweise könnte ein KI-Agent einen Text generieren, ein anderer ihn in einem bestimmten Sprachstil umschreiben. Loop Agents nehmen definierte Inputs entgegen, leiten sie an ein LLM oder einen Workflow weiter und führen diesen Prozess so lange aus, bis eine bestimmte Bedingung erfüllt ist. Diese kann rein mechanischer Natur sein – etwa, den Loop x Mal hintereinander auszuführen. Es kann aber auch darum gehen, bestimmte Kriterien mit Hilfe eines andereren LLM-Agenten zu überprüfen. Ein Beispiel wäre ein Agent, der einen längeren Text simplifiziert, während ein anderer feststellt, ob die vereinfachte Version wichtige Details vermissen lässt (und falls ja, eine neue Version generiert). Parallel Agents führen zwei oder mehr Agenten-Jobs nebeneinander aus und geben die Ergebnisse erst dann aus, wenn alle Tasks abgeschlossen sind. Dabei wird während der Ausführung kein State zwischen den Jobs ausgetauscht. Diese müssen vorab mit den erforderlichen Daten versorgt werden. Ein Beispiel hierfür wäre ein Agent, der im Rahmen der Faktenprüfung eines Dokuments drei verschiedene Suchmaschinen verwendet. Jeder Prüfungsdurchgang wird parallel mit einer anderen Suchmaschine vorgenommen, die Ergebnisse nach Abschluss aller Suchvorgänge miteinander kombiniert. Weil die Workflow Agents im Grunde nur Python- oder Java-Programme sind, sind sie durch das Verhalten konventioneller Programme eingeschränkt. Ein Parallel Agent ist beispielsweise durch die Tasks eingeschränkt, die er parallel ausführen möchte. Soll er mehrere Aufträge auf einem Remote-Dienst ausführen, der aber nur jeweils einen Auftrag von Ihrem API-Key akzeptiert, haben Sie keinen Parallel Agent mehr. KI-Agenten werweitern mit ADK-Tools Mit dem Agent Development Kit erstellte KI-Agenten lassen sich zudem mit diversen Tools erweitern. In diesem Zusammenhang handelt es sich dabei ebenfalls um Python- (oder Java-) Code, der mit Nicht-LLM-Komponenten interagiert. Zum Beispiel, um etwas von einem URL-Endpunkt abzurufen, etwas aus einer Datenbank zu holen oder eine andere Aktion auszuführen, für die kein LLM erforderlich ist (obwohl möglicherweise LLM-generierte Daten zum Einsatz kommen, um die Aufgabe zu erledigen). Die ADK-Tools lassen sich in drei grundlegende Kategorien einteilen: Funktions-Tools wrappen vorhandene Funktionen in der von Ihnen geschriebenen Sprache. Sie geben JSON zurück, sodass alle Datentypen, die für Rückgabewerte verwendet werden standardmäßig JSON-serialisierbar sein müssen. Funktionen können so eingestellt werden, dass sie ausgeführt werden, ohne andere Verhaltensweisen zu blockieren. Sie können aber auch als Agenten fungieren. Integrierte Tools bieten gängige Standardfunktionen wie die Google-Suche, sodass Sie diese nicht von Grund auf neu implementieren müssen. Sie können auch beliebigen Code ausführen oder Google Vertex AI Search über integrierte Funktionen ausführen. Tools von Drittanbietern ermöglichen es anderen Entwicklern, Tools für ihre eigenen Workflows bereitzustellen, beispielsweise LangChain. Es ist zu empfehlen, sämtliche vorhandenen Geschäftslogiken, die Sie mit einem ADK-basierten Agenten verbinden möchten, mit einem Tool zu implementieren. Die Praxis, Logiken stattdessen in den Code des Agenten zu kopieren, sollte ausschließlich für Experimente eingesetzt werden. Empfehlenswerte ADK-Beispielprojekte Die über GitHub einsehbaren ADK-Beispielprojekte sind ein guter Startpunkt: Suchen Sie sich eines aus und passen Sie es auf Ihre eignen Anforderungen an. Die Beispielprojekte decken eine Vielzahl von Use Cases und Verhaltensweisen ab. Die Chance ist hoch, dass ein Muster, das Sie replizieren möchten, bereits vorhanden ist. Diese drei Projekte sind besonders zu empfehlen: LLM Auditor ist ein automatisiertes System, um Fakten mit zwei KI-Agenten zu prüfen. Der eine stellt Behauptungen auf den Prüfstand, der andere erstellt überarbeitete Versionen dieser ursprünglichen Behauptungen – auf Grundlage der Fact-Checking-Ergebnisse. Dieses Beispiel nutzt eine Architektur mit Sequential Agents, die es Ihnen ermöglicht ihr eigenen System daran auszurichten. Customer Service beinhaltet einen KI-Agenten für den Kundenservice, der mit verschiedenen Backend-Diensten verbunden ist, um diverse Tasks in diesem Bereich auszuführen. In diesem Beispiel werden viele verschiedene Tools nachgebildet (etwa Videoanrufe oder die Kommunikation mit Diensten wie Salesforce). Dieses Beispiel lässt sich also bei Bedarf an tatsächliche Backend-Dienste koppeln. Image Scoring Agent generiert Bilder und validiert die Ergebnisse anhand von Kriterien, die an einen anderen Agenten zur Bewertung übermittelt werden. Dieses Beispiel nutzt einen Loop Agent – und eignet sich damit potenziell als Grundlage für Projekte, die erfordern, Inputs kontinuierlich zu verfeinern. (fm) Sie wollen weitere interessante Beiträge zu diversen Themen aus der IT-Welt lesen? Unsere kostenlosen Newsletter liefern Ihnen alles, was IT-Profis wissen sollten – direkt in Ihre Inbox!

So gelingen erste Schritte mit dem quelloffenen Agent Development Kit von Google.Foundry KI-Agenten zu erstellen, ist ein häufiger Anwendungsfall im Bereich Generative AI. Selbst wenn dafür kommerzielle Modelle genutzt werden, kann es allerdings äußerst aufwändig sein, diese Systeme zu entwickeln. Um die Anstrengungen für Entwickler zu reduzieren, hat Google auf seiner Next-Konferenz im April 2025 sein Agent Development Kit (ADK) vorgestellt. Ein quelloffenes Toolkit, das diverse Standardaufgaben übernehmen kann, wenn es darum geht, KI-Agenten zu entwickeln. Dabei unterstützt das ADK sowohl Agenten für simple Tasks als auch solche für komplexe, mehrstufige Workflows. Und: Googles Toolkit funktioniert nicht nur mit den hauseigenen Modellen wie Gemini, sondern auch mit so gut wie allen anderen, die per API bereitgestellt werden. Dieses Tutorial vermittelt, wie Sie: das Agent Development Kit von Google einrichten, KI-Agenten und Multi-Agenten-Architekturen realisieren, Ihre Agenten mit den Zusatz-Tools von Googles ADK erweitern, und sich mit Beispielprojekten den Einstieg erleichtern. Google Agent Development Kit einrichten Googles Agent Development Kit unterstützt zwei Programmiersprachen, Python und Java. Wir nutzen für dieses Tutorial die Python-Version. Um mit dem Agenten-Toolkit arbeiten zu können, erstellen Sie im ersten Schritt eine neue virtuelle Umgebung und installieren das ADK mit folgendem Befehl: pip install google-adk Zu beachten ist dabei, dass dadurch auch eine Vielzahl von Abhängigkeiten installiert wird (zum Zeitpunkt der Erstellung dieses Artikels waren es 84). Sie sollten also mindestens 285 MB Speicherplatz einplanen – nur für die Umgebung und ihre Abhängigkeiten. Außerdem empfiehlt es sich, eine .env-Datei im Stammverzeichnis Ihres Projekts anzulegen. Dort können Sie die API-Keys für die KI-Dienste speichern, mit denen Sie sich verbinden möchten. Das Google ADK erkennt .env-Files automatisch und nutzt deren Inhalt. Dafür müssen Sie also keinerlei Code schreiben. Einen simplen KI-Agenten erstellen Für den Anfang wollen wir mit dem Agent Development Kit einen einfachen KI-Agenten aufsetzen. Sein einziger Task ist es, das Internet nach Antworten auf Fragen zu durchsuchen. Dazu erstellen Sie in Ihrem Projektverzeichnis ein Unterverzeichnis namens searchagent und legen dort zwei Dateien ab. Dabei: markiert __init__.py das Verzeichnis als “Agentenverzeichnis”, indem es den eigentlichen Agenten-Code importiert, während agent.py den Agenten selbst einrichtet – wie durch das Agent-Objekt beschrieben. Der Code für __init__.py: from . import agent Und der für agent.py: from google.adk.agents import Agent from google.adk.tools import google_search root_agent = Agent( name=”search_assistant”, description=”An agent that answers questions augmented with web searches.”, model=”gemini-2.0-flash”, instruction=”Answer questions provided by the user. Compare and contrast information gathered from Google with your own information. If you are given a statement that is not a question, reply, ‘Please ask me a question.'”, tools=[google_search] ) Die gewählte Verzeichnisstruktur (searchagent) ermöglicht es, bei Bedarf mehrere Agenten in einem Projekt zu erstellen, die entweder eigenständig agieren oder zusammenarbeiten können. Als Schnittstelle nutzt (je)der KI-Agent eine Modell-API, in unserem Fall gemini-2.0-flash. Die initialen Befehle an den Agenten, die jedem Benutzer-Input vorangestellt werden, sind in instruction definiert. Dabei ist allerdings zu beachten, dass diese weitaus detaillierter ausgestaltet sein können, als in unserem Beispiel. Der Abschnitt tools enthält zusätzliche Werkzeuge, auf die der KI-Agent zugreifen kann. Das ist in diesem Fall die Google-Suche (google_search), die zum Einsatz kommt, um die Ergebnisse anzureichern. Um diesen Beispiel-Agenten lokal über ein Web-Interface auszuführen, öffnen Sie die Kommandozeile, aktivieren venv und nutzen den Befehl adk web. Nach einer kurzen Wartezeit folgt ein Prompt, der darüber Auskunft gibt, dass das ADK-Interface auf Port 8000 ausgeführt wird. Anschließend können Sie über Ihren Browser zu http://localhost:8000 navigieren. Dort erwartet Sie nun die Standard-ADK-Webschnittstelle mit dem einsatzbereiten simpleagent-Agenten. Falls Sie mehrere Agenten für ein bestimmtes Projekt konfiguriert haben, können Sie über das Dropdown-Menü oben links zwischen diesen wählen. Um sicherzustellen, dass der KI-Agent ordnungsgemäß ausgeführt wird, füttern Sie diesen mit einer Frage – der Output sollte innerhalb weniger Sekunden angezeigt werden. Auf der linken Seite der Benutzeroberfläche werden Debugging-Informationen zu jeder Konversation mit dem Agenten angezeigt. Ein Klick auf das Bot-Symbol links neben der Konversation, macht deren Backend-Details sichtbar – inklusive der vom Dienst zurückgegebenen Metadaten. Die Details variieren je nach Service. srcset=”https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?quality=50&strip=all 1490w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=300%2C168&quality=50&strip=all 300w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=768%2C432&quality=50&strip=all 768w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=1024%2C576&quality=50&strip=all 1024w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=1240%2C697&quality=50&strip=all 1240w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=150%2C84&quality=50&strip=all 150w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=854%2C480&quality=50&strip=all 854w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=640%2C360&quality=50&strip=all 640w, https://b2b-contenthub.com/wp-content/uploads/2025/07/GoogleADK-Screen-2-16z9.jpg?resize=444%2C250&quality=50&strip=all 444w” width=”1024″ height=”576″ sizes=”(max-width: 1024px) 100vw, 1024px”>Wenn Sie die Token Streaming-Option oben rechts im Chatfenster aktivieren, werden die Ergebnisse schrittweise (Wort für Wort) zurückgegeben.Foundry Eine Multi-Agenten-Architektur entwickeln Im nächsten Schritt wollen wir nun ein System entwickeln, bei dem mehrere KI-Agenten parallel arbeiten sollen. Dabei lassen sich die Interaktionen zwischen den Agenten mithilfe sogenannter Workflow Agents kompositionieren. Diese starten die Tasks der Agenten und steuern anschließend, wie diese (auf Grundlage strikter Regeln) ausgeführt werden. Trotz ihres Namens handelt es sich bei den Workflow Agents jedoch nicht um KI-Agenten, sondern lediglich um Programme, die in Python (oder Java) geschrieben sind und die Funktionsweise der Agenten erweitern. Die Workflow Agents treten in verschiedenen Varianten auf: Sequential Agents leiten Benutzer-Inputs an ein spezifisches LLM oder einen bestimmten Workflow weiter, nehmen die Ergebnisse entgegen und leiten diese an ein anderes LLM oder einen anderen Workflow weiter (inklusive einiger zusätzlicher Anweisungen dazu, wie dieser Agent die Eingabe verarbeiten soll). Auf diese Weise lässt sich ein Agent nutzen, um die Outputs eines anderen zu transformieren oder zu verfeinern. Beispielsweise könnte ein KI-Agent einen Text generieren, ein anderer ihn in einem bestimmten Sprachstil umschreiben. Loop Agents nehmen definierte Inputs entgegen, leiten sie an ein LLM oder einen Workflow weiter und führen diesen Prozess so lange aus, bis eine bestimmte Bedingung erfüllt ist. Diese kann rein mechanischer Natur sein – etwa, den Loop x Mal hintereinander auszuführen. Es kann aber auch darum gehen, bestimmte Kriterien mit Hilfe eines andereren LLM-Agenten zu überprüfen. Ein Beispiel wäre ein Agent, der einen längeren Text simplifiziert, während ein anderer feststellt, ob die vereinfachte Version wichtige Details vermissen lässt (und falls ja, eine neue Version generiert). Parallel Agents führen zwei oder mehr Agenten-Jobs nebeneinander aus und geben die Ergebnisse erst dann aus, wenn alle Tasks abgeschlossen sind. Dabei wird während der Ausführung kein State zwischen den Jobs ausgetauscht. Diese müssen vorab mit den erforderlichen Daten versorgt werden. Ein Beispiel hierfür wäre ein Agent, der im Rahmen der Faktenprüfung eines Dokuments drei verschiedene Suchmaschinen verwendet. Jeder Prüfungsdurchgang wird parallel mit einer anderen Suchmaschine vorgenommen, die Ergebnisse nach Abschluss aller Suchvorgänge miteinander kombiniert. Weil die Workflow Agents im Grunde nur Python- oder Java-Programme sind, sind sie durch das Verhalten konventioneller Programme eingeschränkt. Ein Parallel Agent ist beispielsweise durch die Tasks eingeschränkt, die er parallel ausführen möchte. Soll er mehrere Aufträge auf einem Remote-Dienst ausführen, der aber nur jeweils einen Auftrag von Ihrem API-Key akzeptiert, haben Sie keinen Parallel Agent mehr. KI-Agenten werweitern mit ADK-Tools Mit dem Agent Development Kit erstellte KI-Agenten lassen sich zudem mit diversen Tools erweitern. In diesem Zusammenhang handelt es sich dabei ebenfalls um Python- (oder Java-) Code, der mit Nicht-LLM-Komponenten interagiert. Zum Beispiel, um etwas von einem URL-Endpunkt abzurufen, etwas aus einer Datenbank zu holen oder eine andere Aktion auszuführen, für die kein LLM erforderlich ist (obwohl möglicherweise LLM-generierte Daten zum Einsatz kommen, um die Aufgabe zu erledigen). Die ADK-Tools lassen sich in drei grundlegende Kategorien einteilen: Funktions-Tools wrappen vorhandene Funktionen in der von Ihnen geschriebenen Sprache. Sie geben JSON zurück, sodass alle Datentypen, die für Rückgabewerte verwendet werden standardmäßig JSON-serialisierbar sein müssen. Funktionen können so eingestellt werden, dass sie ausgeführt werden, ohne andere Verhaltensweisen zu blockieren. Sie können aber auch als Agenten fungieren. Integrierte Tools bieten gängige Standardfunktionen wie die Google-Suche, sodass Sie diese nicht von Grund auf neu implementieren müssen. Sie können auch beliebigen Code ausführen oder Google Vertex AI Search über integrierte Funktionen ausführen. Tools von Drittanbietern ermöglichen es anderen Entwicklern, Tools für ihre eigenen Workflows bereitzustellen, beispielsweise LangChain. Es ist zu empfehlen, sämtliche vorhandenen Geschäftslogiken, die Sie mit einem ADK-basierten Agenten verbinden möchten, mit einem Tool zu implementieren. Die Praxis, Logiken stattdessen in den Code des Agenten zu kopieren, sollte ausschließlich für Experimente eingesetzt werden. Empfehlenswerte ADK-Beispielprojekte Die über GitHub einsehbaren ADK-Beispielprojekte sind ein guter Startpunkt: Suchen Sie sich eines aus und passen Sie es auf Ihre eignen Anforderungen an. Die Beispielprojekte decken eine Vielzahl von Use Cases und Verhaltensweisen ab. Die Chance ist hoch, dass ein Muster, das Sie replizieren möchten, bereits vorhanden ist. Diese drei Projekte sind besonders zu empfehlen: LLM Auditor ist ein automatisiertes System, um Fakten mit zwei KI-Agenten zu prüfen. Der eine stellt Behauptungen auf den Prüfstand, der andere erstellt überarbeitete Versionen dieser ursprünglichen Behauptungen – auf Grundlage der Fact-Checking-Ergebnisse. Dieses Beispiel nutzt eine Architektur mit Sequential Agents, die es Ihnen ermöglicht ihr eigenen System daran auszurichten. Customer Service beinhaltet einen KI-Agenten für den Kundenservice, der mit verschiedenen Backend-Diensten verbunden ist, um diverse Tasks in diesem Bereich auszuführen. In diesem Beispiel werden viele verschiedene Tools nachgebildet (etwa Videoanrufe oder die Kommunikation mit Diensten wie Salesforce). Dieses Beispiel lässt sich also bei Bedarf an tatsächliche Backend-Dienste koppeln. Image Scoring Agent generiert Bilder und validiert die Ergebnisse anhand von Kriterien, die an einen anderen Agenten zur Bewertung übermittelt werden. Dieses Beispiel nutzt einen Loop Agent – und eignet sich damit potenziell als Grundlage für Projekte, die erfordern, Inputs kontinuierlich zu verfeinern. (fm) Sie wollen weitere interessante Beiträge zu diversen Themen aus der IT-Welt lesen? Unsere kostenlosen Newsletter liefern Ihnen alles, was IT-Profis wissen sollten – direkt in Ihre Inbox!

Ähnliche Beiträge