使用 Google Gemini 3 Pro Image API 生成和编辑图片,支持文本生成图片和图片转图片工作流,分辨率可达 1K、2K 或 4K。
npx clawhub@latest install nano-banana-pro系统要求
Nano Banana Pro 是一项由 Google Gemini 图像模型驱动的图像生成与编辑技能。它同时支持文本生成图像和图像编辑功能,让你可以通过提示词生成全新的视觉内容,或使用自然语言指令对现有图像进行修改。三种输出分辨率(1K、2K、4K)让你可以先在低分辨率下快速迭代,再生成高质量的最终成品。
npx clawhub@latest install nano-banana-pro点击本页顶部的 安装 按钮即可一键设置
GEMINI_API_KEY,并在 CLI/Agent 环境中工作,可以通过 --input-image 参数传入图像路径。GEMINI_API_KEY。在提示词中描述任何主题、风格、构图、光线和色彩搭配,技能将生成一张 PNG 图像并保存到您当前的工作目录。内置提示词模板,即使输入内容较为模糊,也能获得高命中率的生成结果。
通过 --input-image 传入现有图像,并仅描述需要更改的内容。内置的编辑提示模板有助于保留其他所有内容——主体、姿势、光照、背景以及现有文字——同时应用单一精确的修改。
选择 1K(约 1024px)进行快速迭代,选择 2K(约 2048px)获得中等质量输出,或选择 4K(约 4096px)生成高分辨率最终成品。Nano Banana Pro 会自动将用户常用的表达方式(如"高清"或"超清")映射到正确的 API 参数。
推荐的工作流程从 1K 草稿开始,以便快速获取反馈,支持在多次迭代中不断优化提示词(编辑时保持相同的 --input-image 不变),并且只有在提示词确认无误后才升级到 4K——从而节省时间和 API 配额。
输出文件会根据提示上下文自动以 yyyy-mm-dd-hh-mm-ss-descriptive-name.png 的格式命名,让您的工作目录在多次生成运行中保持整洁有序。
通过自然语言描述,快速生成视觉概念——包括角色、场景、产品模型等。在导出用于演示的 4K 终稿之前,先以 1K 分辨率对风格和构图进行反复调整优化。
对现有照片或设计素材进行修改,例如"去除背景中的人物"、"改为水彩画风格"或"让天空更有戏剧感",无需打开图形编辑器即可完成。
将 Nano Banana Pro 集成到基于 CLI 驱动的 AI 代理管道中,按需生成图像,作为更大任务的一部分——例如,为以编程方式构建的文档或网站生成插图资源。
提供一张源图像,并指示 Nano Banana Pro 将其以不同的视觉风格重新诠释——卡通、油画、电影风格——同时保持原始构图和主体不变。
GEMINI_API_KEY 环境变量,或在运行时通过 --api-key 传入。您的 Google Cloud / AI Studio 账号必须已开启图像生成访问权限。npx clawhub@latest install nano-banana-pro系统要求
登录后撰写评价
暂无评价。来分享你的使用体验吧!