前言
在使用Stable Diffusion WebUI绘制图片时一般不建议使用太高的分辨率,无论在文生图还是图生图中分辨率一高就容易出各种奇怪的图像,所以768*768像素基本是我常用的最高分辨率了,不过这样子生成的图的分辨率还是比较低的,而且在生成全身照的时候,人脸基本上是惨不忍睹的。
即便是开启人脸修复,效果也是很难接受的。比起直接生成半身照,效果可以说的天壤之别,那么要是在这基础上提高分辨率,通过重绘人脸会不会改善呢?
提高分辨率
在Stable Diffusion WebUI中,文生图中可以可以通过高清修复来提升分辨率,按照作者的介绍说,这个高清修复其实就是使用了图生图功能对图片进行放大。其实就是这个高清修复就是把文生图出来的图片用图生图调高分辨率又再跑了一次。
根据之前的经验,使用用0.5的重绘幅度的效果不错。那么在图生图中把没有进行面容修复的图片进行放大,倍率是2.5。从得出来的图可以看出脸还是修复的挺好的。关于重绘幅度也可以看看这里:Stable Diffusion WebUI中的重绘幅度在提升图片分辨率中的使用
另外再看看0.2和0.7重绘幅度下的结果,明显重绘幅度低的话脸修不过来,重绘幅度高的话,受分辨率影响图容易畸形。再次印证了在这个需求下重绘幅度过高或过低均不适宜。
那么文生图又怎么呢?从上面结果来看是基本一致的。
注意上面文生图中放大算法选用的是R-ESRGAN 4x+,而在图生图的界面中并没有这个放大算法的选项,但这肯定是有一个默认的放大算法的,不过在这里看前面图生图和这里文生图出来的结果还是十分相似的,当然,重绘幅度大的除外。
找了一下,在设置中发现有关于放大算法的设置,而其中就有关于图生图中放大算法的设置,于是就把它设置成前面提到的R-ESRGAN 4x+,据说这个放大算法对写实图片最适合。
再从图生图中用三个重绘幅度(0.2、0.5和0.7)对图片进行放大,这次就更加接近文生图中出来的结果了,但也没到完全一样,所以要说通过文生图或者图生图来放大图片是完全一致就不准确了。
除了细节有极细微差别外,文生图和图生图的批量放大操作略有差别,在提示词一致的情况下,图生图可以使用批量处理功能来放大,而文生图要通过X/Y/Z Plot脚本指定seed来批量放大,稍微复杂一点,或许另外再补充例子说明吧。
总结
- 通过文生图或者图生图来放大图片的效果是基本一致的,细节有极细微的差别。
- 文生图中可以直接选择放大算法,图生图中放大算法要在设置中设定。
- 放大过程中要控制重绘幅度来达到修复面容效果,过低面容修复不足,过高画面容易畸形。
- 两个功能都可以批量处理图片放大。
- 生成全身照,面容修复开不开都差别不大。
当然,上面也只是鼓捣中的一些发现,面容的修复或者提高分辨率应该还有其他办法,只是暂时我还没学到。
插曲
尝试的过程我一开始其实选错了模型,换了一个跟原图不一样的模型,通过图生图和文生图出来的结果就很不一样了。
从上面效果说明了,如果想通过变换模型改变画风但维持画面的话需要使用图生图。
绘图主要参数:
adorable woman in chinese park, dynamic angle, close-up, leaves, wind, full medium shot, 105mm lens, intricate details, long hair flowing with the wind, black kimono, futuristic, cyberpunk, sword, circuitry,tall,skinny, beautiful natural soft rim light, crystal feathers, roots, fine foliage lace, colorful details, pearl earrings, piercing, art nouveau fashion embroidered, intricate details, mesh wire, mandelbrot fractal, facial muscles, cable wires, microchip, badass, hyper realistic, ultra detailed, octane render, volumetric lighting, 8k post-production,looking at viewer, head wings, veil,floating headgear, biopunk, photorealistic, masterpiece,highres,8k,character concept,depth of field,perfect pupils,perfect smiles,(full body:1.2)
Negative prompt: paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)),ngdeepnegative_v1
75t
Steps: 40, Sampler: DPM++ SDE Karras, CFG scale: 7, Seed: 2115617130, Size: 512x768, Model hash: 7234b76e42, Model: chilloutmix_Ni