
?️ 第一步:开工前的「弹药库」准备
1. 注册账号与软件下载
2. 数据集搭建:让 AI 知道你要画什么
- 确定主题:比如你想画「古风汉服少女」,就去花瓣网、Pinterest 搜关键词,挑 200-300 张构图相似、色调统一的图,记住要选无水印的高清图(分辨率至少 1024×1024)。
- 分类整理:新建文件夹,按「正面特写」「全身站姿」「动态抓拍」分三个子目录,每个类别保证 50 张以上,这样 AI 能学会不同角度的细节处理。
- 重命名技巧:文件名写成「古风汉服_正面_长发_红裙_001.jpg」,用下划线分隔关键词,方便后续训练时 AI 识别特征。
3. 硬件配置:别让电脑拖后腿
- 显卡:Nvidia 显卡至少 RTX 3060(6GB 显存),AMD 显卡暂时不推荐,兼容性还在优化。
- 内存:16GB 以上,训练时别开太多程序,Chrome 浏览器 tabs 控制在 5 个以内。
- 硬盘:准备 100GB 以上的空闲空间,训练数据和生成的模型都会占不少容量。
? 第一阶段:基础模型训练,让 AI 先「认识」你的风格
1. 基础参数设置
- 训练类型选「文本到图像模型」,数据集路径指向刚才整理好的文件夹。
- 批次大小(Batch Size):新手直接选 8,显卡显存够的话可以调到 16,数值越大训练速度越快,但容易过拟合(画面出现奇怪噪点)。
- 训练轮数(Epoch):先设 20 轮,这时候别去干别的,盯着日志窗口,看到「损失值(Loss)」稳定在 0.8-1.2 之间就可以停,超过 1.5 说明数据有问题,得回去检查图片质量。
2. 文本编码器调整:给 AI 装个「翻译器」
3. 数据增强设置:让 AI 学会「举一反三」
- 旋转角度:±15°,模拟不同拍摄角度。
- 亮度 / 对比度:±0.2,避免 AI 只认固定光线条件。
- 随机裁剪:保留 70%-90% 的画面,让 AI 学会处理不同构图。
这一步做完,相当于把 200 张图变成了 800 张「虚拟训练图」,模型会更健壮。
4. 训练中的「紧急刹车」技巧
- 人物五官扭曲(比如眼睛长到太阳穴)—— 说明数据集里有低质图,用「图片筛选工具」把模糊、构图奇怪的图删掉。
- 所有生成图都是同一种姿势 —— 可能是分类文件夹里某一类图片太少,至少补到 50 张再继续。
? 第二阶段:精细调优,让画面从「能用」变「惊艳」
1. 加载基础模型,开启「精细化模式」
- 批次大小调小到 4,让 AI 更专注细节处理。
- 训练轮数设为 10-15 轮,别贪心调太高,否则容易把之前学的东西「洗掉」。
2. 加入「控制网络」:手把手教 AI 构图
- Canny 边缘控制:先把参考图用 PS 转成线稿,拖进 ControlNet 界面,AI 会严格按照线稿的构图来生成,再也不怕人物比例失调。
- Depth 深度图:想让画面有立体感?用 MidJourney 生成一张深度图(关键词加 depth map),导入后 AI 会自动处理远近景深,8K 图的层次感就靠这个。
3. 关键词「进阶公式」:让描述更精准
主体描述 + 细节特征 + 风格限定 + 技术参数
举个例子:
「穿着明制马面裙的少女,裙摆绣着缠枝莲纹,头发梳成椎髻包布,手持油纸伞站在青石板路上」(主体细节)
「水墨工笔画风格,线条细腻流畅,色彩饱和度 60%,光影采用侧逆光」(风格限定)
「8K 分辨率,超高细节,无压缩画质,真实相机镜头感」(技术参数)
把这些分三段写进 prompt 框,生成效果直接提升一个档次。
4. 8K 图生成设置:别让「分辨率」拖后腿
- 在生成界面点击「高级设置」,分辨率选 3840×5120(竖图)或 5120×3840(横图),这是标准的 8K 尺寸。
- 采样方法选「DPM++ 2M Karras」,降噪强度设 0.75,既能保留细节又能减少噪点。
- 生成批次选 1-2 张,别贪多,每张图生成时间控制在 3-5 分钟(视显卡性能而定)。
? 实战避坑指南:新手常见问题解决方案
1. 生成图和训练图风格不一致?
- 检查是不是没开「风格继承」:在模型加载界面,勾选「保留基础模型风格权重 80%」,别让微调把基础学的东西全丢了。
- 看看关键词里有没有冲突描述,比如同时写「赛博朋克」和「水墨风」,AI 会懵圈,每次训练只专注 1-2 种核心风格。
2. 人物手部总是畸形?
- 训练时多加入手部特写图,至少 50 张不同手势(握拳、持物、比心等),让 AI 学会手部结构。
- 生成时用「局部重绘」功能:导出图片后,在编辑界面框选手部,输入「五指分明,手部皮肤细腻,关节结构正确」,让 AI 单独优化这部分。
3. 训练速度太慢怎么办?
- 关掉客户端右上角的「实时预览」,能节省 30% 的算力。
- 把数据集里的图片统一压缩到 2MB 以内(用图压工具,别改分辨率),读取速度会快很多。
4. 8K 图保存后变模糊?
- 不直接在预览窗口保存,要点击「完整尺寸导出」。
- 不选 JPG 格式,用 PNG-24 位模式,保留透明通道和完整色彩信息。
- 不在微信直接发送原图,先用压缩软件转成适合社交平台的尺寸,发朋友圈时勾选「原图」即可。
? 进阶技巧:让你的作品比别人多「亿」点细节
1. 加入「负向关键词」:排除不想要的效果
「低分辨率,锯齿边缘,模糊不清,噪点过多,色彩断层,畸形肢体,多余物体」
2. 动态姿势生成:让人物「动」起来
3. 批量生成 + 人工筛选:提高出图效率
- 按「Delete」键删掉明显失败的(比如五官错位)
- 按「1」键标记优质图,后续可以用这些图做「二次训练」,让模型越来越懂你的审美。
? 最后提醒:训练数据的「隐形红线」
- 包含真实人物肖像(明星、网红照片),容易触发版权警告。
- 暴力、色情、政治敏感内容,账号会被直接封禁。
- 低质网络图(压缩严重、有水印、分辨率低于 500×500),宁可少训也别凑数,否则模型会「学坏」。