一览 AI 绘图新手入门：从文生图到图生图的完整操作流程

AI Insight 专栏作者

2025-06-18

2.6k 阅读

53 评论

? 工具选择：找到最适合你的 AI 绘图助手
刚接触 AI 绘图时，选对工具能让你少走很多弯路。目前主流的工具各有特点，比如 Midjourney 生成速度快、风格多样，适合快速出图； Stable Diffusion 开源免费、自由度高，适合有技术基础的用户进行深度定制； DALL·E 3 则与 ChatGPT 深度整合，对自然语言的理解能力更强，生成的图像更贴近你的描述。国内用户还可以试试 商汤秒画 和 即梦 AI，这两个工具操作简单，支持中文提示词，特别适合新手。

比如你想生成一张二次元风格的插画，Midjourney 可能更适合；要是你需要对生成的图像进行精细控制，像调整人物姿势或局部细节，Stable Diffusion 搭配 ControlNet 插件会更强大。

? 文生图：从文字到画面的魔法
文生图是 AI 绘图的基础功能，操作并不复杂。以 Stable Diffusion 为例，你需要先安装软件并设置好参数，比如采样方法、采样步数、图像尺寸等。然后在提示词输入框中描述你想要的画面，比如 “一个穿着红色连衣裙的女孩站在开满樱花的树下，阳光透过树叶洒在她身上，风格类似宫崎骏的动画”。提示词越具体，生成的图像就越符合你的预期。

这里有个小技巧，你可以添加反向提示词来排除不想要的元素，比如 “不要出现人物的手部畸形”。如果生成的图像不够满意，你可以调整参数或修改提示词，多次生成后选择最理想的结果。

? 图生图：让创意在原有画面上延伸
图生图是在已有图像的基础上进行二次创作。以 Midjourney 为例，你需要先上传参考图，复制图片链接，然后在 /imagine 命令中输入链接和描述词，比如 “URL1 一个拿着魔法棒的巫师，背景是星空，风格改为赛博朋克”。通过调整参数 iw（参考权重），你可以控制新生成的图像与原图的相似程度，iw 值越高，图像越接近原图。

举个例子，你有一张猫咪的照片，想把它变成卡通风格。你可以上传照片，输入提示词 “URL1 一只可爱的卡通猫，戴着蝴蝶结，背景是彩虹”，然后设置 iw 值为 0.8，这样生成的图像会保留猫咪的基本特征，同时呈现出卡通风格。

⚙️ 参数调整：让画面更完美
参数调整是 AI 绘图的关键环节，不同的参数组合会产生截然不同的效果。比如在 Stable Diffusion 中，采样方法选择 DPM++ 2M Karras，采样步数设置为 30-50，可以在速度和细节之间取得平衡。如果你想要更高的分辨率，可以使用 Hires.fix 功能，但这会增加生成时间。

对于 Midjourney，你可以通过添加参数来控制图像的尺寸、风格等。比如 “--ar 16:9” 可以设置图像的宽高比，“--v 5” 可以指定使用的模型版本。

? 提示词优化：让 AI 更懂你的心
提示词是 AI 绘图的核心，优化提示词能显著提升生成效果。你可以采用 “主体 + 环境 + 风格” 的三段式结构，比如 “一只机械恐龙（主体）在火山口咆哮（环境），风格为蒸汽朋克（风格）”。同时，你可以参考他人的提示词，比如在 Midjourney 的社区中搜索类似主题的作品，学习他们的描述方式。

另外，你可以使用权重符号 “::” 来强调某些关键词，比如 “一个穿着蓝色外套的男孩::1.2，站在海边::0.8”，这样 AI 会更关注男孩的服装细节。

? 进阶技巧：提升效率和创意
如果你想进一步提升 AI 绘图的效率和创意，可以尝试以下方法：

使用插件：Stable Diffusion 的 ControlNet 插件可以精准控制人物的姿势、线稿上色等；Midjourney 的 “describe” 功能可以分析图片并生成提示词。
模型融合：将不同的模型权重插值，比如 70% 的 SDXL 模型 + 30% 的 SD 1.5 模型，可以增强光影细节。
批量生成：在 Stable Diffusion 中使用 ComfyUI 搭建工作流，一次性生成多张图片，适合需要大量素材的场景。

?️ 常见问题解决
在使用 AI 绘图工具时，你可能会遇到一些问题：