Nano Banana Pro

Name: Nano Banana Pro
Author: Peter Steinberger

Nano Banana Pro Skill-Übersicht

Nano Banana Pro ist eine Skill zur Bildgenerierung und -bearbeitung, die auf Googles Gemini-Bildmodell basiert. Sie unterstützt sowohl Text-zu-Bild-Erstellung als auch Bild-zu-Bild-Bearbeitung und ermöglicht es dir, neue Visualisierungen aus einem Prompt zu generieren oder bestehende Bilder mithilfe von Anweisungen in natürlicher Sprache zu verändern. Drei Ausgabeauflösungen (1K, 2K, 4K) ermöglichen es dir, schnell in niedriger Auflösung zu iterieren, bevor du dich für ein hochwertiges finales Rendering entscheidest.

So verwenden Sie es

Step 1: Im Terminal ausführen oder auf AgentCellar installieren

npx clawhub@latest install nano-banana-pro

oder

Klicke oben auf der Seite auf Installieren für die Ein-Klick-Einrichtung

When to Use Nano Banana Pro

Best Fit

Sie möchten ein neues Bild aus einer Textbeschreibung generieren, mit Kontrolle über Stil, Komposition und Auflösung.
Sie müssen ein vorhandenes Bild bearbeiten — Farben ändern, Elemente entfernen, den Stil anpassen oder Effekte anwenden — indem Sie die Änderung in einfacher Sprache beschreiben.
Sie möchten einen schnellen Entwurf → Iteration → Endresultat-Workflow: einen günstigen 1K-Entwurf generieren, den Prompt verfeinern und dann erst ein 4K-Endergebnis erstellen, wenn der Prompt feststeht.
Sie haben einen GEMINI_API_KEY und arbeiten in einer CLI/Agent-Umgebung, in der Sie --input-image-Pfade übergeben können.

When Not to Use

Sie benötigen ein Nicht-Google-Bildmodell (z. B. DALL·E, Stable Diffusion, Flux) – dieser Skill verwendet ausschließlich die Gemini Image API.
Sie haben keinen gültigen GEMINI_API_KEY mit aktiviertem Bildgenerierungszugang in Ihrem Konto.

Hauptfunktionen

Text-zu-Bild-Generierung

Beschreibe ein beliebiges Motiv, einen Stil, eine Komposition, Beleuchtung und Farbpalette in einem Prompt, und der Skill erstellt ein PNG-Bild, das in deinem aktuellen Arbeitsverzeichnis gespeichert wird. Prompt-Vorlagen sind enthalten, um auch bei vagen Eingaben treffsichere Ergebnisse zu erzielen.

Bild-zu-Bild-Bearbeitung

Übergib ein vorhandenes Bild über --input-image und beschreibe nur, was geändert werden soll. Eine integrierte Bearbeitungs-Prompt-Vorlage hilft dabei, alles andere zu erhalten – Motiv, Pose, Beleuchtung, Hintergrund und vorhandenen Text – während eine einzige präzise Änderung angewendet wird.

Drei Ausgabeauflösungen (1K / 2K / 4K)

Wähle 1K (~1024px) für schnelle Iterationen, 2K (~2048px) für mittelqualitative Ausgaben oder 4K (~4096px) für hochauflösende Endergebnisse. Der Skill ordnet gängige Benutzerbegriffe wie „hi-res" oder „ultra" automatisch dem richtigen API-Parameter zu.

Entwurf → Iterieren → Finaler Workflow

Der empfohlene Workflow beginnt mit einem 1K-Entwurf für schnelles Feedback, ermöglicht die Verfeinerung des Prompts über mehrere Iterationen (wobei dasselbe --input-image für Bearbeitungen beibehalten wird), und führt erst dann ein Upgrade auf 4K durch, wenn der Prompt bestätigt ist – so werden Zeit und API-Kontingent gespart.

Generierung von Dateinamen mit Zeitstempel

Ausgabedateien werden automatisch nach dem Muster yyyy-mm-dd-hh-mm-ss-descriptive-name.png benannt, das aus dem Prompt-Kontext abgeleitet wird, und halten Ihr Arbeitsverzeichnis über mehrere Generierungsläufe hinweg organisiert.

Anwendungsfälle

Konzeptkunst und kreatives Prototyping

Generiere schnell visuelle Konzepte – Charaktere, Umgebungen, Produktmockups – indem du sie in natürlicher Sprache beschreibst. Iteriere Stil und Komposition in 1K, bevor du ein 4K-Finale für die Präsentation exportierst.

Fotobearbeitung per natürlicher Sprache

Nehmen Sie ein vorhandenes Foto oder Design-Asset und wenden Sie Änderungen an wie „entferne die Person im Hintergrund", „ändere den Stil zu einem Aquarellgemälde" oder „mache den Himmel dramatischer" – ganz ohne einen Grafikeditor zu öffnen.

Automatisierte Bildgenerierung in Agenten-Workflows

In eine CLI-gesteuerte KI-Agenten-Pipeline integrieren, um Bilder bei Bedarf als Teil einer größeren Aufgabe zu generieren – zum Beispiel zur Erstellung von Illustrationsressourcen für ein Dokument oder eine Website, die programmatisch aufgebaut wird.

Stiltransfer und Bildtransformation

Stellen Sie ein Quellbild bereit und weisen Sie die Skill an, es in einem anderen visuellen Stil neu zu interpretieren – Cartoon, Ölgemälde, Kinoästhetik – während die ursprüngliche Komposition und das Motiv erhalten bleiben.

Voraussetzungen

LLM / Image API Key (erforderlich) — Authentifiziert sich bei der Google Gemini Image API. Als GEMINI_API_KEY Umgebungsvariable festlegen oder zur Laufzeit über --api-key übergeben. Für Ihr Google Cloud / AI Studio-Konto muss der Zugriff auf die Bildgenerierung aktiviert sein.

Verbindung zum Agenten wird hergestellt...

npx clawhub@latest install nano-banana-pro

364Sterne

91.7kDownloads

944Aktuelle Installationen

818Gesamte Installationen

v1.0.0Version

Apr 30, 2026Aktualisiert

Voraussetzungen

LLM API Key

Quellcode ansehen(ClawHub)

FAQ

Bewertungen

0 Bewertungen

Anmelden, um eine Bewertung zu schreiben

Noch keine Bewertungen. Sei der Erste, der seine Erfahrungen teilt!