Nano Banana Pro

Name: Nano Banana Pro
Author: Peter Steinberger

Destacado

Genera y edita imágenes con la API de imágenes Gemini 3 Pro de Google — flujos texto a imagen e imagen a imagen en resoluciones 1K, 2K o 4K.

Peter Steinbergerv1.0.0

Conectando a tu agente...

npx clawhub@latest install nano-banana-pro

364Estrellas

91.7kDescargas

944Instalaciones actuales

818Instalaciones totales

v1.0.0Versión

Apr 30, 2026Actualizado

Requisitos

LLM API Key

Ver código fuente(ClawHub)

Descripción del skill Nano Banana Pro

Nano Banana Pro es una habilidad de generación y edición de imágenes impulsada por el modelo de imágenes Gemini de Google. Admite tanto la creación de texto a imagen como la edición de imagen a imagen, lo que te permite generar nuevos elementos visuales a partir de un prompt o modificar imágenes existentes con instrucciones en lenguaje natural. Tres resoluciones de salida (1K, 2K, 4K) te permiten iterar rápidamente a baja resolución antes de comprometerte con un renderizado final de alta calidad.

Cómo usarlo

Step 1: Ejecuta en tu terminal o instala este skill en AgentCellar

npx clawhub@latest install nano-banana-pro

Haz clic en el botón Instalar en la parte superior de esta página para una configuración rápida

When to Use Nano Banana Pro

Best Fit

Quieres generar una nueva imagen a partir de una descripción de texto, con control sobre el estilo, la composición y la resolución.
Necesitas editar una imagen existente — cambiar colores, eliminar elementos, ajustar el estilo o aplicar efectos — describiendo el cambio en lenguaje natural.
Quieres un flujo de trabajo borrador rápido → iterar → final: genera un borrador económico en 1K, refina el prompt y luego produce el resultado final en 4K solo cuando el prompt esté definido.
Tienes una GEMINI_API_KEY y trabajas en un entorno CLI/agente donde puedes pasar rutas con --input-image.

When Not to Use

Necesitas un modelo de imágenes que no sea de Google (p. ej. DALL·E, Stable Diffusion, Flux) — esta habilidad utiliza exclusivamente la API de imágenes de Gemini.
No tienes una GEMINI_API_KEY válida con acceso a la generación de imágenes habilitado en tu cuenta.

Características principales

Generación de Imágenes a partir de Texto

Describe cualquier sujeto, estilo, composición, iluminación y paleta de colores en un prompt y la habilidad producirá una imagen PNG guardada en tu directorio de trabajo actual. Se incluyen plantillas de prompts para obtener resultados de alta calidad incluso a partir de entradas vagas.

Edición de imagen a imagen

Pasa una imagen existente mediante --input-image y describe solo lo que debe cambiar. Una plantilla de indicación de edición integrada ayuda a preservar todo lo demás — sujeto, pose, iluminación, fondo y texto existente — mientras aplica una única modificación precisa.

Tres resoluciones de salida (1K / 2K / 4K)

Elige 1K (~1024px) para iteración rápida, 2K (~2048px) para salida de calidad media, o 4K (~4096px) para resultados finales en alta resolución. La habilidad asigna automáticamente frases comunes del usuario como "alta resolución" o "ultra" al parámetro de API correcto.

Flujo de Trabajo: Borrador → Iteración → Final

El flujo de trabajo recomendado comienza con un borrador en 1K para obtener retroalimentación rápida, permite refinar el prompt a lo largo de múltiples iteraciones (manteniendo la misma --input-image para las ediciones), y solo actualiza a 4K una vez que el prompt está confirmado — ahorrando tiempo y cuota de API.

Generación de nombres de archivo con marca de tiempo

Los archivos de salida se nombran automáticamente con el patrón yyyy-mm-dd-hh-mm-ss-nombre-descriptivo.png derivado del contexto del prompt, manteniendo tu directorio de trabajo organizado a lo largo de múltiples ejecuciones de generación.

Casos de uso

Concept art y prototipado creativo

Genera rápidamente conceptos visuales — personajes, entornos, maquetas de productos — describiéndolos en lenguaje natural. Itera sobre el estilo y la composición a 1K antes de exportar un resultado final en 4K para su presentación.

Edición de fotos mediante lenguaje natural

Toma una foto existente o un recurso de diseño y aplica cambios como "eliminar a la persona en el fondo", "cambiar a un estilo de pintura en acuarela" o "hacer el cielo más dramático" sin necesidad de abrir un editor gráfico.

Generación automática de imágenes en flujos de trabajo de agentes

Intégralo en un pipeline de agente de IA impulsado por CLI para generar imágenes bajo demanda como parte de una tarea más amplia — por ejemplo, produciendo recursos de ilustración para un documento o sitio web que se construye de forma programática.

Transferencia de estilo y transformación de imágenes

Proporciona una imagen de origen e indica a la skill que la reinterprete en un estilo visual diferente — caricatura, pintura al óleo, cinematográfico — conservando intactos la composición y el sujeto originales.

Requisitos

LLM / Image API Key (requerido) — Se autentica con la API de imágenes de Google Gemini. Configúralo como variable de entorno GEMINI_API_KEY o pásalo mediante --api-key en tiempo de ejecución. Tu cuenta de Google Cloud / AI Studio debe tener habilitado el acceso a la generación de imágenes.

Conectando a tu agente...

npx clawhub@latest install nano-banana-pro

364Estrellas

91.7kDescargas

944Instalaciones actuales

818Instalaciones totales

v1.0.0Versión

Apr 30, 2026Actualizado

Requisitos

LLM API Key

Ver código fuente(ClawHub)

Preguntas frecuentes

Reseñas

0 reseñas

Inicia sesión para escribir una reseña

Aún no hay reseñas. ¡Sé el primero en compartir tu experiencia!