Genera y edita imágenes con la API de imágenes Gemini 3 Pro de Google — flujos texto a imagen e imagen a imagen en resoluciones 1K, 2K o 4K.
npx clawhub@latest install nano-banana-proRequisitos
Nano Banana Pro es una habilidad de generación y edición de imágenes impulsada por el modelo de imágenes Gemini de Google. Admite tanto la creación de texto a imagen como la edición de imagen a imagen, lo que te permite generar nuevos elementos visuales a partir de un prompt o modificar imágenes existentes con instrucciones en lenguaje natural. Tres resoluciones de salida (1K, 2K, 4K) te permiten iterar rápidamente a baja resolución antes de comprometerte con un renderizado final de alta calidad.
npx clawhub@latest install nano-banana-proHaz clic en el botón Instalar en la parte superior de esta página para una configuración rápida
GEMINI_API_KEY y trabajas en un entorno CLI/agente donde puedes pasar rutas con --input-image.GEMINI_API_KEY válida con acceso a la generación de imágenes habilitado en tu cuenta.Describe cualquier sujeto, estilo, composición, iluminación y paleta de colores en un prompt y la habilidad producirá una imagen PNG guardada en tu directorio de trabajo actual. Se incluyen plantillas de prompts para obtener resultados de alta calidad incluso a partir de entradas vagas.
Pasa una imagen existente mediante --input-image y describe solo lo que debe cambiar. Una plantilla de indicación de edición integrada ayuda a preservar todo lo demás — sujeto, pose, iluminación, fondo y texto existente — mientras aplica una única modificación precisa.
Elige 1K (~1024px) para iteración rápida, 2K (~2048px) para salida de calidad media, o 4K (~4096px) para resultados finales en alta resolución. La habilidad asigna automáticamente frases comunes del usuario como "alta resolución" o "ultra" al parámetro de API correcto.
El flujo de trabajo recomendado comienza con un borrador en 1K para obtener retroalimentación rápida, permite refinar el prompt a lo largo de múltiples iteraciones (manteniendo la misma --input-image para las ediciones), y solo actualiza a 4K una vez que el prompt está confirmado — ahorrando tiempo y cuota de API.
Los archivos de salida se nombran automáticamente con el patrón yyyy-mm-dd-hh-mm-ss-nombre-descriptivo.png derivado del contexto del prompt, manteniendo tu directorio de trabajo organizado a lo largo de múltiples ejecuciones de generación.
Genera rápidamente conceptos visuales — personajes, entornos, maquetas de productos — describiéndolos en lenguaje natural. Itera sobre el estilo y la composición a 1K antes de exportar un resultado final en 4K para su presentación.
Toma una foto existente o un recurso de diseño y aplica cambios como "eliminar a la persona en el fondo", "cambiar a un estilo de pintura en acuarela" o "hacer el cielo más dramático" sin necesidad de abrir un editor gráfico.
Intégralo en un pipeline de agente de IA impulsado por CLI para generar imágenes bajo demanda como parte de una tarea más amplia — por ejemplo, produciendo recursos de ilustración para un documento o sitio web que se construye de forma programática.
Proporciona una imagen de origen e indica a la skill que la reinterprete en un estilo visual diferente — caricatura, pintura al óleo, cinematográfico — conservando intactos la composición y el sujeto originales.
GEMINI_API_KEY o pásalo mediante --api-key en tiempo de ejecución. Tu cuenta de Google Cloud / AI Studio debe tener habilitado el acceso a la generación de imágenes.npx clawhub@latest install nano-banana-proRequisitos
Inicia sesión para escribir una reseña
Aún no hay reseñas. ¡Sé el primero en compartir tu experiencia!