Bilder generieren und bearbeiten mit Googles Gemini 3 Pro Image API – Text-zu-Bild und Bild-zu-Bild Workflows in 1K, 2K oder 4K.
npx clawhub@latest install nano-banana-proVoraussetzungen
Nano Banana Pro ist eine Skill zur Bildgenerierung und -bearbeitung, die auf Googles Gemini-Bildmodell basiert. Sie unterstützt sowohl Text-zu-Bild-Erstellung als auch Bild-zu-Bild-Bearbeitung und ermöglicht es dir, neue Visualisierungen aus einem Prompt zu generieren oder bestehende Bilder mithilfe von Anweisungen in natürlicher Sprache zu verändern. Drei Ausgabeauflösungen (1K, 2K, 4K) ermöglichen es dir, schnell in niedriger Auflösung zu iterieren, bevor du dich für ein hochwertiges finales Rendering entscheidest.
npx clawhub@latest install nano-banana-proKlicke oben auf der Seite auf Installieren für die Ein-Klick-Einrichtung
GEMINI_API_KEY und arbeiten in einer CLI/Agent-Umgebung, in der Sie --input-image-Pfade übergeben können.GEMINI_API_KEY mit aktiviertem Bildgenerierungszugang in Ihrem Konto.Beschreibe ein beliebiges Motiv, einen Stil, eine Komposition, Beleuchtung und Farbpalette in einem Prompt, und der Skill erstellt ein PNG-Bild, das in deinem aktuellen Arbeitsverzeichnis gespeichert wird. Prompt-Vorlagen sind enthalten, um auch bei vagen Eingaben treffsichere Ergebnisse zu erzielen.
Übergib ein vorhandenes Bild über --input-image und beschreibe nur, was geändert werden soll. Eine integrierte Bearbeitungs-Prompt-Vorlage hilft dabei, alles andere zu erhalten – Motiv, Pose, Beleuchtung, Hintergrund und vorhandenen Text – während eine einzige präzise Änderung angewendet wird.
Wähle 1K (~1024px) für schnelle Iterationen, 2K (~2048px) für mittelqualitative Ausgaben oder 4K (~4096px) für hochauflösende Endergebnisse. Der Skill ordnet gängige Benutzerbegriffe wie „hi-res" oder „ultra" automatisch dem richtigen API-Parameter zu.
Der empfohlene Workflow beginnt mit einem 1K-Entwurf für schnelles Feedback, ermöglicht die Verfeinerung des Prompts über mehrere Iterationen (wobei dasselbe --input-image für Bearbeitungen beibehalten wird), und führt erst dann ein Upgrade auf 4K durch, wenn der Prompt bestätigt ist – so werden Zeit und API-Kontingent gespart.
Ausgabedateien werden automatisch nach dem Muster yyyy-mm-dd-hh-mm-ss-descriptive-name.png benannt, das aus dem Prompt-Kontext abgeleitet wird, und halten Ihr Arbeitsverzeichnis über mehrere Generierungsläufe hinweg organisiert.
Generiere schnell visuelle Konzepte – Charaktere, Umgebungen, Produktmockups – indem du sie in natürlicher Sprache beschreibst. Iteriere Stil und Komposition in 1K, bevor du ein 4K-Finale für die Präsentation exportierst.
Nehmen Sie ein vorhandenes Foto oder Design-Asset und wenden Sie Änderungen an wie „entferne die Person im Hintergrund", „ändere den Stil zu einem Aquarellgemälde" oder „mache den Himmel dramatischer" – ganz ohne einen Grafikeditor zu öffnen.
In eine CLI-gesteuerte KI-Agenten-Pipeline integrieren, um Bilder bei Bedarf als Teil einer größeren Aufgabe zu generieren – zum Beispiel zur Erstellung von Illustrationsressourcen für ein Dokument oder eine Website, die programmatisch aufgebaut wird.
Stellen Sie ein Quellbild bereit und weisen Sie die Skill an, es in einem anderen visuellen Stil neu zu interpretieren – Cartoon, Ölgemälde, Kinoästhetik – während die ursprüngliche Komposition und das Motiv erhalten bleiben.
GEMINI_API_KEY Umgebungsvariable festlegen oder zur Laufzeit über --api-key übergeben. Für Ihr Google Cloud / AI Studio-Konto muss der Zugriff auf die Bildgenerierung aktiviert sein.npx clawhub@latest install nano-banana-proVoraussetzungen
Anmelden, um eine Bewertung zu schreiben
Noch keine Bewertungen. Sei der Erste, der seine Erfahrungen teilt!