Fay项目笔记


大模型项目笔记

Fay项目

带货版

部署

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Wayne:
部署模型很简单 随便上hugginface调一个,随便写个函数 又没有上下文


Wayne:
或者可以用openllm

Wayne:
随便部署个

随遇而安:
微软的tts非必填,可以使用默认的edge_tts

随遇而安:
新手可以选择直接对接在线的大模型。chatglm、funasr这些本地化的都需要一定的技术的

本地大模型方案

1
2
3
rasa+chatglm

up主配置:3060显卡+12g显存+cpu:amd ryzen 9 5900x +内存:64G

JittorLLMs

1
2
3
4
5
你好,这是Bing。很高兴为你提供帮助。😊

WSL是Windows Subsystem for Linux的缩写,意思是Windows系统的Linux子系统,它可以让你在Windows上运行Linux环境和应用程序,而不需要虚拟机或双重启动⁵。WSL有两个版本,WSL 1和WSL 2,它们有不同的体系结构和性能¹。你可以通过Microsoft Store或命令行安装和管理不同的Linux发行版,例如Ubuntu、Debian、Kali等²。

如果你想通过WSL部署Windows 10,你需要满足一些先决条件,例如运行Windows 10版本2004或更高版本,并启用虚拟机平台功能²。然后你可以使用wsl --install命令来安装WSL和Ubuntu发行版²。安装完成后,你需要为Linux发行版创建一个用户账户和密码,并根据你的需要进行一些设置和优化²。

常识

1
CUDA是英伟达(NVIDIA)推出的一种通用并行计算架构,它可以利用GPU的强大计算能力来加速各种应用程序,特别是深度学习等领域123。CUDA提供了一套编程接口,让开发者可以在C/C++等语言中编写GPU核函数,实现数据并行的计算密集型任务24。CUDA还提供了一些数学库,如CUFFT和CUBLAS,以及针对深度卷积神经网络的加速库CUDNN25。如果您想使用CUDA进行GPU编程,您需要安装CUDA工具包,并且确保您的显卡是NVIDIA的支持CUDA的型号
1
PyTorch 是一种基于 Python 的科学计算库,它可以用于构建深度学习模型,特别是在图像识别和自然语言处理等领域有很强的表现123。PyTorch 的特点是使用动态计算图,这意味着可以根据需要随时修改模型的结构和参数2。PyTorch 还提供了丰富的工具和库,支持各种数据处理、可视化、调试、优化等功能1。PyTorch 可以很好地与 Numpy 和其他 Python 库集成,方便开发者使用 Python 语言进行深度学习的开发和研究1。
1
2
3
4
AIGC功能的服务器是指用于支持AIGC技术的服务器,它们通常需要具备高性能的计算能力和存储能力,以处理大量的数据和模型123。AIGC功能的服务器可以分为训练服务器和推理服务器,根据不同的场景和需求,选择不同的硬件配置和软件平台12。

训练服务器:用于训练AIGC模型,需要消耗大量的算力和时间,通常使用GPU或FPGA等异构计算设备来加速训练过程12。训练服务器的硬件配置要求较高,需要有足够的内存、显存、硬盘空间等。训练服务器的软件平台可以使用CUDA、TensorFlow、PyTorch等深度学习框架,以及各种数学库和工具包12。
推理服务器:用于运行AIGC模型,提供内容生成服务,需要快速响应用户的请求,通常使用CPU或GPU等异构计算设备来加速推理过程12。推理服务器的硬件配置要求较低,主要取决于模型的复杂度和服务的规模等。推理服务器的软件平台可以使用ONNX、TensorRT、OpenVINO等推理引擎,以及各种部署工具和框架

内存

1
2
3
4
5
6
7
8
9
10
11
12
您好,这是Bing。如果您想要通过任务管理器查看您的电脑有多少个内存卡槽,您可以按照以下步骤操作:

使用 Ctrl + Alt + Del 快捷键打开「任务管理器」。
点击「性能」标签。
再点击左侧「内存」项。
在「任务管理器」右下方即可查看到当前设备内存插槽总数和已使用的插槽个数。12
您也可以使用「命令提示符」来查看内存卡槽的信息,具体方法如下:

使用 Win + R 组合快捷键,打开「运行」操作框。
在打开后面输入命令 cmd ,并点击下方的「确定」进入命令操作窗口。
然后在打开的CMD命令窗口输入命令: wmic memphysical get maxcapacity, memorydevices 。
这样就可以看到内存卡槽的个数和最大支持的内存容量。
1
2
3
4
5
6
7
8
9
10
11
12
您好,这是Bing。最大支持容量是指您的电脑主板能够识别和使用的内存容量的上限。也就是说,如果您的电脑最大支持32GB的内存,那么即使您安装了64GB的内存条,也只能用到32GB。1

要查看您的电脑最大支持多少内存,您可以使用命令提示符来查询。具体方法如下:

使用 Win + R 组合快捷键,打开「运行」操作框。
在打开后面输入命令 cmd ,并点击下方的「确定」进入命令操作窗口。
然后在打开的CMD命令窗口输入命令: wmic memphysical get maxcapacity 。
这样就可以看到一个数字,这个数字是以千字节为单位的最大支持内存容量。
您可以用这个公式来换算成GB单位: GB = 千字节 ÷1024÷1024 。2
例如,如果您查询出 33554432 这个数字,经过计算就可以得知,您的电脑最大支持 32GB 的内存。

目前,大部分家用笔记本电脑的最大支持内存容量都在 16GB 到 64GB 之间。要想达到 256GB 的内存,可能需要专业的工作站或服务器级别的笔记本电脑。3
1
2
3
4
5
6
7
8
9
10
11
12
13
您好,这是Bing。根据笔记本型号和内存条参数去购买,是指您需要根据您的笔记本电脑的品牌和型号,以及您的内存条的类型、容量、频率等信息,去选择合适的内存条。1

不同的笔记本电脑可能支持不同的内存条规格,例如 DDR3 或 DDR4,以及不同的最大容量和最大频率。23

内存条的参数一般可以在内存条的标签上看到,例如 8G 2*4GB DDR4 2666MHz 这样的信息。

8G 表示总容量是 8GB。
2*4GB 表示是两根 4GB 的内存条组成的双通道。
DDR4 表示是 DDR4 类型的内存条。
2666MHz 表示是 2666MHz 的频率。
您也可以通过任务管理器或者第三方软件来查看您的笔记本电脑和内存条的参数。12

如果您想要加装或者更换内存条,您需要购买和您的笔记本电脑和原有内存条相匹配的内存条,否则可能会出现兼容性问题或者性能下降。
1
2
3
4
5
6
7
8
9
10
11
12
譬如单条内存话可以说是随便插了,两条内存选择插2、4插槽。考虑兼容性问题,最好是同品牌同型号同容量的内存。假如是4G+8G组合一共12G,结果是4G+4G为双通道模式,另外4G为单通道模式,这种情况属于弹性双通模式,也叫做非对称双通模式。除此之外可能还会带来一些兼容性问题,比如蓝屏死机之类的;三条内存的情况,在双通道插法的基础上,第三条再插在第一个槽上,这种情况就是2条内存双通,1条内存单通。这句话的2、4插槽是什么意思

这句话的意思是,如果您有两根内存条,要插在主板上的第二个和第四个插槽上,这样可以组成双通道模式,提高内存的性能。双通道模式是指两根内存条分别在两个不同的通道上工作,相当于增加了内存的带宽,可以提高数据传输的速度。12

一般来说,主板上有四个内存插槽,分为A通道和B通道,每个通道有两个插槽,分别编号为A1、A2、B1、B2。如下图所示:3

如果您要使用双通道模式,您需要注意以下几点:

您的两根内存条要和主板、CPU、系统等硬件兼容,不能超过主板支持的最大内存容量。
您的两根内存条要和原有的内存条同样的DDR代数,比如DDR4,否则无法插入或者识别。
您的两根内存条最好和原有的内存条同样的品牌、型号、频率、时序等规格,这样可以避免兼容性问题。
您的两根内存条要插在同一颜色或者同一编号奇偶性的插槽上,比如A2和B2或者A1和B1,这样可以保证两根内存条在不同的通道上工作。

命令

1
查看显存 cmd + dxdiag

anaconda

虚拟环境

1
2
3
4
5
conda create --name your-env


conda create --name your-env your-pkg
conda create --name snakes python=3.5
1
2
3
conda activate your-env

conda deactivate
1
conda info -e
1
conda remove --name ENVNAME --all

包管理

1
2
3
conda list

conda search packagename 安装时

镜像源

1
2
3
4
5
conda config --show channels

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

conda config --remove channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
1
2
3
4
5
6
7
8
9
你可以使用以下命令来设置conda和pip的镜像源:

- 配置conda镜像源:`conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud`¹
- 配置pip镜像源:在命令行中输入以下命令:

- 清华pip镜像:`pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple`
- 阿里pip镜像:`pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/`
- 腾讯pip镜像:`pip config set global.index-url https://mirrors.cloud.tencent.com/pypi/simple`
- 豆瓣pip镜像:`pip config set global.index-url https://pypi.douban.com/simple/`²³

回滚env

1
2
3
conda list --revisions

conda install --revision N
1
2
3
4
5
6
conda env export > envName.yml

# 使用旧环境名
conda env create -f envName.yml
# 指定新环境名
conda env create -f envName.yml -n newEnvName

pip

1
2
3
4
如果你没有进入conda环境,使用pip安装的依赖是全局的,会被安装到全局环境中¹²。如果你想要在局部环境中安装依赖,可以使用`pip install --user`命令³。


在conda中,base环境使用的依赖是全局的,会被安装到全局环境中¹²。如果你想要在局部环境中安装依赖,可以使用`pip install --user`命令³。

stable diffusion

提示词

1
2
3
正向提示词

排除词
1
2
3
4
5
6
7
8
9
10
11
提示词拆分:

①对于使用提示词生成图像生成的小伙伴来说,当看到喜欢的图像或脑海中想到很多画面,但却不知道如何用提示词准确描述,现在有三种方法可以帮助大家快速拆分和生成图像。

Stable Diffusion 中自带反推功能,可以通过将想要拆分的图像拖入反推,点击按钮来获得生成该图像的提示词。第一次使用可能会有些慢,需要稍等片刻。需要注意的是,这些提示词需要进行后期的优化,常用的方法是通过百度翻译后进行增删改,或者输入到 GPT 中进行优化,优化后将提示词放入相应的框内进行图像输出。

②第二种方法我们可以借助三方网站:https://replicate.com/

来进行拆分,拆分好后,同第一条一样,进行一个增删改,然后我们对两种方法进行比较,通过比较后,我们可以进行词汇的筛选与合并

③利用 gpt 或文心等相关工具,将想要描述的长句输入,最后加一句描述,请将这句话拆分为 Stable Diffusion 的提示词,如果不满意可以继续恢复优化提示词,或者换一批相关描述,然后将转换好的提示词同 ①一样增删改

图像尺寸

1
画面的信息量取决于输出图片的大小。在全身构图中,一些细节,例如脸部、饰品和复杂的纹样,只有在较大的图像中才能得到充分的展示空间,如图像太小,脸部,手部,一些细节就会被压缩成一团,无法得到充分的表现,以下图的风景为例,当画幅越大时,展示的内容越多。

image-20230702144539022

权重

1
2
3
4
5
6
正如前文所述,词汇在提示中的位置越靠前,其所占的权重就越大。为了进一步调整提示关键词的权重,我们可以通过以下语法来设置关键词的权重:在选中关键词的同时,按下键盘上的 Ctrl+⬆️ ⬇️来快速调整权重。每次调整的权重值为0.1,建议将权重值控制在0.7-1.4之间。简单来说,将每个提示词看作一个独立的个体,权重默认为1,而后面的数值就相当于在修改这个默认值。当然,我们也可以将权重调整为负数,从而在提示中产生与原意相反的影响。通过这种方法,我们可以更加精确地控制提示关键词的权重,以达到更好的提示效果。同时,我们也需要注意保持提示内容的流畅性和自然性,避免过度的修改导致提示内容的语义不连贯或不符合实际情况。

作者:无为设计研究所
链接:https://zhuanlan.zhihu.com/p/629521125
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

提示词相关性

1
Stable Diffusion 中的提示词相关性指的是输入提示词对生成图像的影响程度。当我们提高提示词相关性时,生成的图像将更符合提示信息的样子;相反,如果提示词相关性较低,对应的权重也较小,则生成的图像会更加随机。因此,通过调整提示词相关性,可以引导模型生成更符合预期的样本,从而提高生成的样本质量。①在具体应用中,对于人物类的提示词,一般将提示词相关性控制在 7-15 之间;②而对于建筑等大场景类的提示词,一般控制在 3-7 左右。这样可以在一定程度上突出随机性,同时又不会影响生成图像的可视化效果。因此,提示词相关性可以帮助我们通过引导模型生成更符合预期的样本,从而提高生成的样本质量。

随机种子

1
2
3
随机种子是一个可以锁定生成图像的初始状态的值。当使用相同的随机种子和其他参数,我们可以生成完全相同的图像。设置随机种子可以增加模型的可比性和可重复性,同时也可以用于调试和优化模型,以观察不同参数对图像的影响。在 Stable Diffusion 中,常用的随机种子有-1 和其他数值。当输入-1 或点击旁边的骰子按钮时,生成的图像是完全随机的,没有任何规律可言。而当输入其他随机数值时,就相当于锁定了随机种子对画面的影响,这样每次生成的图像只会有微小的变化。因此,使用随机种子可以控制生成图像的变化程度,从而更好地探索模型的性能和参数的影响。

在工作产出中,如果细微调整,我们将会固定某个种子参数然后进行批量生成

采样方法

Euler a

image-20230702153640124

1
2
3
Euler a: 20

①Euler a 是一种用于控制时间步长大小的可调参数,在 Stable Diffusion 中采用 Euler 时间步长采样方法。适当的 Euler a 值能够捕捉到细节和纹理,但如果值太大会导致过度拟合,生成图像出现噪点等不良效果。②一句话概括:采样生成速度最快,但是如果说在高细节图增加采样步数时,会产生不可控突变(如人物脸扭曲,细节扭曲等)适合:ICON,二次元图像,小场景

DPM++2S a Karras

1
2
3
4
5
DPM++2S a Karras

①采用 DPM++2S a Karras 采样方法生成高质量图像,该方法在每个时间步长中执行多次操作,同等分辨率下细节会更多,比如可以在小图下塞进全身,代价是采样速度更慢

②适合:写实人像,复杂场景刻画

DDIM

1
2
3
DDIM

①DDIM 采样方法可以快速生成高质量的图像,相比其他采样方法具有更高的效率,想尝试超高步数时可以使用,随着步数增加可以叠加细节②适合:写实人像,复杂场景刻画下图为大家展示 DDIM 同提示词不同步幅下的输出图像,可以看到随着步幅的提高,细节和丰富度逐渐提高

采样迭代步数

1
输出画面需要的步数,每一次采样步数都是在上一次的迭代步骤基础上绘制生成一个新的图片,一般来说采样迭代步数保持在 18-30 左右即可,低的采样步数会导致画面计算不完整,高的采样步数仅在细节处进行优化,对比输出速度得不偿失。

模型

Checkpoint 的介绍

1
对于模型作者而言,训练模型通常指生成 Checkpoint 文件。这些文件包含了模型参数和优化器状态等信息,是训练过程中定期保存的状态快照。对于使用者而言,可以将 Checkpoint 文件理解为一种风格滤镜,例如油画、漫画、写实风等。通过选择对应的 Checkpoint 文件,您可以将 Stable Diffusion 模型生成的结果转换为您所选择的特定风格。需要注意的是,一些 Checkpoint 文件可能需要与特定的低码率编码器(如 Lora)配合使用,以获得更好的效果。在下载 Checkpoint 文件时,您可以查看相应的模型简介,通常作者会提供相应的文件和说明事项,以帮助您更好地使用和理解该文件。总之,Checkpoint 文件是 Stable Diffusion 模型训练过程中定期保存的状态快照,使用者可以将其理解为一种风格滤镜,用于将模型输出结果转换为特定的风格。在使用 Checkpoint 文件时,需要注意文件的匹配和相应的使用说明。

下载

墨幽2.5D_MIX_MoYou2.5D_MIX

image-20230702171425104

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
qq群号:858495398 (刚建群,现在加入就是元老哦)

也请多多关注我的小红书和抖音账号:yy469370733

喜欢的话点赞关注返图哦!!!感谢!!!

先看说明!!!

本次同时上传了2.23g的修剪版,供显存不足的小伙伴使用(修剪版在细节表现上好像要弱一点~区别不大,但体积小,出图速度也更快)

不要开面部修复!

基于墨幽MIX_MoYouMIX_nature_v10.2制作的2.5d版墨幽

中西结合的风格,现在古风皆可



无realistic——2.3D,有realistic——2.8D

推荐tag:

正:1girl,moyou,realistic,

负:lowres,bad anatomy,bad hands,text,error,missing fingers,extra digit,fewer digits,cropped,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,blurry,Black background,Long Neck,(narrow shoulder:1.1),Cock-eye,EasyNegative,Neck forward,Thin,slim figure,

推荐参数:

vae:840000

采样:DPM++ 2M SDE Karras

步数:20-30

高分辨率修复参数:(一定要开!)

放大算法:4×-UltraSharp

重绘幅度:0.25(可适当调整)

放大倍数:2

点赞关注哦!欢迎多多反馈返图!!!

感谢!!!

https://www.liblibai.com/modelinfo/f10bf7fb091cb29ecc9fd89d0482646e

情景描述
1
2
3
4
5
6
7
prompt:1girl,moyou,realistic,masterpiece, best quality, black hair, against backlight at dusk, cityscape, blue hairband, goggles, earrings, shackles, fingerless_gloves, necklace
Negative prompt:lowres,bad anatomy,bad hands,text,error,missing fingers,extra digit,fewer digits,cropped,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,blurry,Black background,Long Neck,(narrow shoulder:1.1),Cock-eye,EasyNegative,Neck forward,Thin,slim figure,
Sampler:DPM++ 2M SDE Karras
model:
CFG scale:7
steps:20
seed:3669909696
1
2
3
4
5
6
7
prompt:1girl,moyou,realistic,Moderatechest,
Negative prompt:NSFW,((Bare fingers)),(worst quality:1.4), (low quality:1.4), (monochrome:1.4), easynegative,lowres,bad anatomy,bad hands,(Bare toe)text,error,missing fingers,extra digit,fewer digits,cropped,transition exposure,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,blurry,missing arms,long neck,Humpbacked,poorly drawn hands,signature,artist name,malformed mutated,deformed,text,blurry,fused fingers,missing fngers,mutated hands and fingers,more than 2 thighs,malformed limbs,missing legs,extra legs,mutation poorly drawn,mutated hands
Sampler:DPM++ 2M Karras
model:
CFG scale:7
steps:150
seed:3709181679
正面词
1
<lora:唯美_Mr_MC_R-WM_V1.2_R-WM_V1.2:0.45>,1girl,Mr_MC_R-WM_V1,brown hair, looking at viewer, scarf, long hair,Thin,slim figure,blurry, outdoors, pink scarf, lips, upper body, blurry background, earrings, jewelry, bangs, solo focus, day, closed mouth, solo, winter clothes, long sleeves, sweater, depth of field, realistic, coat, green eyes, blush, wind
1
prompt:Mr_MC_R-WM_V1,<lora:Mr_MC_R-WM_V1.2:0.8>,1girl,long hair,solo,floating hair,upper body,Big bust,sleeveless,parted lips,red lips,lips,pink hair,turtleneck,bare shoulders,(flower),eyelashes,<lora:detailia_yiu_v20:0.2>,
1
Mr_MC_R-WM_V1, <lora:Mr_MC_R-WM_V1.2:0.8>,1girl, long hair, solo, floating hair, closed eyes, upper body, sleeveless, parted lips, red lips, lips, pink hair, turtleneck, bare shoulders, (flower), eyelashes
1
<lora:Mr_MC_R-WM_V1:1>,1girl,Mr_MC_R-WM_V1,brown hair, looking at viewer, scarf, long hair, blurry, outdoors, pink scarf, lips, upper body, blurry background, earrings, jewelry, bangs, solo focus, day, closed mouth, solo, winter clothes, long sleeves, sweater, depth of field, realistic, coat, green eyes, blush, wind
1
Mr_MC_R-WM_V1, <lora:Mr_MC_R-WM_V1.2:0.87>,1girl, brown hair, looking at viewer, long hair, solo, outdoors, blurry, scarf, lips, upper body, day, sweater, blurry background, bangs, earrings, closed mouth, winter clothes, jewelry, pink scarf, green eyes, building, long sleeves, depth of field, realistic, winter, coat
负面词
1
digits,cropped,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,username,blurry,Black background,Long Neck,(narrow shoulder:1.1),Cock-eye,EasyNegative,Neck forward

CMixS_v1.0.ckpt

image-20230702202902721

1
2
3
4
5
模型介绍:欢迎使用CMix-S模型 - 这是一个古典/未来科幻风格模型,也可以说是一个具有2.5D质感的细腻画风模型,具有2.5D的质感。

创意描述:赛博/蒸汽朋克风+机甲,古典与科技结合。

生成建议:模型上手简单,记得选择VAE(推荐840000),更多参数可以参考示例图。如果脸部稍有瑕疵可以打开Face Editor插件。
正面词
负面词(模型要求第一个)
1
(((simple background))),monochrome ,lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, lowres, bad anatomy, bad hands, text, error, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, ugly,pregnant,vore,duplicate,morbid,mut ilated,tran nsexual, hermaphrodite,long neck,mutated hands,poorly drawn hands,poorly drawn face,mutation,deformed,blurry,bad anatomy,bad proportions,malformed limbs,extra limbs,cloned face,disfigured,gross proportions, (((missing arms))),(((missing legs))), (((extra arms))),(((extra legs))),pubic hair, plump,bad legs,error legs,username,blurry,bad feet

本地位置

img

VAE 的介绍

1
2
3
可以将 VAE 理解为对模型的滤镜加微调,不同的 VAE 可能有一些细节上的差异,但不会影响输出的效果。

它可以增强模型的表现,有些模型文件已经自带了 VAE 效果,因此不需要盲目地去挂载,可以选择自动模式来简化日常使用。

embedding 的介绍

1
如果你有做过 UI 的经验,那么你应该知道组件的概念。在 Stable Diffusion 中,embedding 技术就可以被理解为一种组件,它可以将输入数据转换成向量表示,方便模型进行处理和生成。举个例子,如果我们想要生成一个开心的皮卡丘,通常需要输入很多描述词,如黄毛、老鼠、长耳朵、腮红等等。但是,如果引入皮卡丘的 embedding,我们只需要输入两个词:皮卡丘和开心。皮卡丘的 embedding 打包了所有皮卡丘的特征描述,这样我们就不用每次输入很多单词来控制生成的画面了。在日常使用中,embedding 技术通常用于控制人物的动作和特征,或者生成特定的画风。相比于其他模型(如 LORA),embedding 的大小只有几十 KB,而不是几百兆或几 GB,除了还原度对比 lora 差一些但在存储和使用上更加方便。总之,embedding 技术将输入数据转换为向量表示,为模型的处理和生成提供了便利。通过使用 embedding,我们可以更加轻松地生成符合预期的样本,而不需要手动输入大量的描述词汇。

LORA 的介绍

1
LORA 与 embedding 在本质上类似,因为携带着大量的训练数据,所以 LORA 对人物和细节特征的复刻更加细腻使用技巧:通常来说,每个 LORA 模型都有对应的底膜和触发词汇。我们可以查看 LORA 作者产出的相关图片,从中获取模型信息,并从中选择一些提示词和排除词来指定生成图像的方向。需要注意的是,每个 LORA 模型对输出图像的权重设置是非常重要的。权重设置越大,对画面的影响因素就越浅。通常情况下,权重应该控制在 0.7-1 之间。如果权重过高,会大幅度影响出图的质量。为了获得最佳效果,我们可以根据不同的 LORA 模型选择适当的提示词和排除词,并在设置权重时进行调整。同时,我们还可以参考其他作者的经验和技巧,以便更好地利用 LORA 生成图像。

下载

唯美_Mr_MC_R-WM_V1.2_R-WM_V1.2

科幻Q版机甲少年

image-20230702203128548

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
-模型简介:科幻Q版3D风格,适合生成男孩、女孩及机器人。

-创意概述:突发奇想,假如科幻的主题融入到Q版男女孩风格里会是怎样一副画面,于是就大胆的尝试了一下,感觉还不错,希望能帮到你。适用于大部分2.5D模型。

-生成建议:

搭配底膜建议:CMixs_v1.0,Good Asian Girl Face_GoodAsianGirlFaceV1.2

采样方法建议:DPM++ 2M SDE Karras

权重建议:0.5-0.8

尺寸建议:512*768

提示词引导系数建议:7-8之间

全息故障_Holographic_Fault_v1.0

1
眼部容易出问题,需要开启面部修复

图生图

无损放大图像和缩小图像

https://blog.csdn.net/qq_20288327/article/details/131439726

hires.fix高分辨率修复

1
2
3
在生成图片时,可选择使用hires.fix高分辨率修复功能,该功能会将生成图片的尺寸从512×512调整至1024×1024,然而这可能会降低出图的速度。

点击高清修复,处理逻辑是先生成图像,然后根据图像放大后保存。

image-20230702190913605

extras附加功能

1
2
3
4
5
这里更为推荐的是使用extras附加功能。选择菜单栏中的extras,然后上传图片或者在生成图片后,点击右下角的send to extras即可。

首先我们使用文生图功能生成我们需要的图片。

将生成好的图片通过send to extras选项卡移动到附加功能

image-20230702191020379

1
图片会直接移动到Single Image下。

image-20230702191139785

1
2
3
4
5
6
7
8
在Scale by多选框中,提供了多种无损放大算法,例如Lanczos、Nearest、4x-UltraSharp、LDSR、R-ESRGAN 4x+、R-ESRGAN 4x+ Anime6B、SwinlR 4x等。这些算法有各自的特点和适用场景:

Lanczos:传统插值算法,效果一般,不推荐使用。
LDSR:图片放大质量优秀,特别适合照片类图片,但速度慢。
4x-UltraSharp:能让图片更平滑、锐利,适合修复表面纹理有问题的图片。
R-ESRGAN 4x+:增强型ESRGAN,可修复各种真实世界的图像,保留图片中的精细细节,产生清晰锐利的图像,适用于大部分图像,尤其是逼真的照片。
R-ESRGAN-4x±Anime6B:适合动漫类图片放大。
SwinIR_4x:适合绘画类图片放大。

放大功能

R-ESRGAN 4x+
1
2
3
一般情况下选择R-ESRGAN 4x+即可满足大多数需求。

用该算法默认将图片放大4倍,即将512×768像素的图片放大成2048×3072像素。
1
对于人物脸部图片,可以考虑选用CodeFormer和GFPGAN。这两个选项能修复人脸图片的一些问题,如GFPGAN可以软化修复眼睛。

image-20230702191646645

CodeFormer和GFPGAN
1
下面是4K有使用和无使用CodeFormer和GFPGAN的对比。

image-20230702191723227

1
同理除了放大之外有时也需要缩放功能,点击选项卡Scale to即可,操作和放大是一样的。

image-20230702191825887


本文标题:Fay项目笔记

文章作者:TTYONG

发布时间:2023年06月28日 - 14:06

最后更新:2023年07月03日 - 01:07

原始链接:http://tianyong.fun/Fay%E9%A1%B9%E7%9B%AE%E7%AC%94%E8%AE%B0.html

许可协议: 转载请保留原文链接及作者。

多少都是爱
0%