meiyouruguo 发表于 2023-9-8 15:59:14

DeepFaceLab中训练参数的详细解释


几个小时备份一次? Autobackup every N hour ( 0..24 ?:help ) :
自动备份间隔时间 (0..24 ?:help):这个参数用于启用自动备份模型,您可以设置模型每隔多少小时自动备份。将其设置为0表示禁用自动备份。


保存预览历史记录 Write preview history ( y/n ?:help ) :
写入预览历史记录 (y/n ?:help):此选项控制是否在训练期间保存预览图像。如果选择是(y),则会在训练过程中定期保存预览图像,否则选择否(n)将使模型随机选择面部用于预览。


目标迭代次数 Target iteration :
目标迭代次数:此选项指定训练将停止的迭代次数。如果将其设置为0,训练将一直运行,直到您手动停止它。


随机翻转源人脸 Flip SRC faces randomly ( y/n ?:help ) :
随机翻转SRC面部 (y/n ?:help):此选项控制是否在训练期间随机水平翻转源面部。这可以帮助覆盖目标数据集中的所有角度,但在某些情况下可能会使结果看起来不自然。


随机翻转目标人脸 Flip DST faces randomly ( y/n ?:help ) :
随机翻转DST面部 (y/n ?:help):此选项控制是否在训练期间随机水平翻转目标面部。这可以改善模型的泛化能力


批量大小 Batch_size ( ?:help ) :
批量大小 (?:help):批处理大小设置影响每次迭代中要比较的面部数量。较低的值可能会加快初始训练速度,但建议在6-12之间选择较高的值。


Resolution ( 64-640 ?:help ) : 分辨率
分辨率 (64-640 ?:help):此选项设置模型的分辨率,影响交换面部的分辨率。这是一个不能在训练过程中更改的设置。


Face type ( h/mf/f/wf/head ?:help ) : 面部类型
面部类型 (h/mf/f/wf/head ?:help):此选项允许您选择要训练的面部区域类型,包括半脸、中半脸、全脸、整脸和头部。


Architecture (df/liae/df-u/liae-u/df-d/liae-d/df-ud/liae-ud ?:help ) :
架构 (df/liae/df-u/liae-u/df-d/liae-d/df-ud/liae-ud ?:help):此选项允许您选择不同的模型架构,包括DF和LIAE以及它们的变体。


Auto Encoder Dims ( 32-2048 ?:help ) :
自动编码器维度 (32-2048 ?:help):此选项影响模型学习面部的能力。


Inter Dims ( 32-2048 ?:help ) :
中间维度 (32-2048 ?:help):此选项影响模型学习面部的能力,对于AMP。


Encoder Dims ( 16-256 ?:help ) :
编码器维度 (16-256 ?:help):此选项影响编码器学习面部的能力。


Decoder Dims ( 16-256 ?:help ) :
解码器维度 (16-256 ?:help):此选项影响解码器重新创建面部的能力。


Decoder Mask Dims ( 16-256 ?:help ) :
解码器掩码维度 (16-256 ?:help):此选项影响学习掩码的质量。


Morph factor ( 0.1 .. 0.5 ?:help ) :AMP模型有,其他模型无此参数
变形因子 (0.1 .. 0.5 ?:help):此选项影响模型将面部形态化为更像源面部的程度。


训练遮罩 Masked training ( y/n ?:help ) :
Masked training (英文翻译:掩码训练) (y/n ?:help):启用掩码训练,将面部训练与背景区分开。此选项控制是否启用遮罩训练。默认情况下,它被设置为 "y",表示启用。
如果启用了遮罩训练(y),模型将重点训练被遮罩(默认遮罩或应用的xseg遮罩)的区域。这意味着模型会更专注于学习面部和面部特征,而将背景区域视为次要。
如果禁用了遮罩训练(n),则整个样本区域,包括面部和背景,都以相同的优先级进行训练。这意味着模型将不会将面部与背景区分开,而是平等对待它们。
通常情况下,启用遮罩训练有助于模型更好地学习和重建面部,因为它将面部区域视为重点。但是,具体的设置取决于您的训练需求和目标。如果您想要更好地保留背景特征,可以选择禁用遮罩训练。


眼睛和嘴巴优先 Eyes and mouth priority ( y/n ?:help ) : n
眼睛和嘴巴优先级 (y/n ?:help):尝试通过优先级训练眼睛和嘴巴以改善其质量。


侧脸优化 Uniform yaw distribution of samples ( y/n ?:help ) : n
均匀偏航 (y/n ?:help):帮助训练侧脸,强制模型均匀训练不同方向的面部。


遮罩边缘模糊 Blur out mask ( y/n ?:help ) : n
模糊掩码 (y/n ?:help):模糊掩码区域以获得更平滑的背景。


将模型和优化器放在GPU上 Place models and optimizer on GPU ( y/n ?:help ) :
放置模型和优化器在GPU上 (y/n ?:help):启用GPU优化器,将所有负载放在GPU上,从而提高性能。

使用信仰优化器 Use AdaBelief optimizer? ( y/n ?:help ) :
使用AdaBelief优化器? (y/n ?:help):启用AdaBelief优化器,以提高模型的准确性和质量。

使用学习率dropout Use learning rate dropout ( n/y/cpu ?:help ) : n
使用学习率降落 (y/n/cpu ?:help):启用学习率降落,加速面部训练并减少子像素抖动。

随机扭曲 Enable random warp of samples ( y/n ?:help ) : y
启用样本的随机扭曲 (y/n ?:help):启用随机扭曲,以便在训练的初始阶段泛化模型。

随机色调/饱和度/光强度 Random hue/saturation/light intensity ( 0.0 .. 0.3 ?:help ) : 0
启用HSV变换 (0.0 .. 0.3 ?:help):应用随机的色调、饱和度和亮度变化,仅影响源数据集以提高颜色稳定性。

GAN强度 GAN power ( 0.0 .. 5.0 ?:help ) : 0
GAN强度 (0.0 .. 10.0 ?:help):启用GAN训练,以获得更详细/锐利的面部。这是一个可调整的参数,建议在0.01左右。

'True face' power. ( 0.0000 .. 1.0 ?:help ):这个参数用于控制“真实面部”训练的强度。它允许您设置模型鉴别器的值,该设置会尝试使最终生成的面部看起来更像源面部。但是,需要注意以下几点:
启用这个功能后,模型会更努力地让最终生成的面部更接近源面部,这可能会使面部看起来更锐利,但也可能改变光照和颜色匹配,甚至在极端情况下可能使面部看起来似乎改变了角度。
这个功能应该仅在关闭随机变形(random warp)并且模型训练得相对充分后才启用。在启用之前,最好备份一下模型,因为它可能会导致模型的外观发生较大变化。通常,建议将其设置为小于等于0.01的值,但也可以尝试更小的值,如0.001。它会略微影响性能。默认值为0.0(禁用)。

Face style power ( 0.0..100.0 ?:help ) 和 Background style power ( 0.0..100.0 ?:help ):这两个参数用于控制图像的样式转移,分别用于面部(FSP)和背景(BSP)部分。样式转移是一种将目标/目的地图像的颜色信息应用到最终预测的面部或背景上,从而改善光照和颜色匹配。但是,较高的值可能会导致最终生成的面部更像目标面部,而不像源面部。
建议从小的值(如0.001-0.1)开始,并根据需要增加或减小它们。这两个功能都会影响内存使用,可能导致内存不足错误,因此您可能需要降低批处理大小以使用它们。

Color transfer for src faceset ( none/rct/lct/mkl/idt/sot ?:help ):这个参数用于匹配数据_src的颜色,以使最终结果的皮肤颜色/色调类似于数据_dst,并且在训练后,面部在移动时颜色不会发生变化,从而减少闪烁、色彩偏移或变化。有几种选项可供选择,包括不使用任何颜色转移。选择哪种颜色转移方法取决于您的训练需求和数据的特性。

Enable gradient clipping ( y/n ?:help ):这个功能用于防止模型崩溃或损坏,这可能会发生在使用DFL 2.0的各种功能时。它对性能有一定影响,但如果启用它,可以防止模型崩溃。模型崩溃时,您将不得不从头开始训练模型,因此建议在使用DFL 2.0的高级功能(如样式权重)时启用梯度剪裁。

Enable pretraining mode ( y/n ?:help ):启用预训练模式后,模型将首先使用一个随机人物的数据集进行预训练,然后再使用实际的数据_src和数据_dst进行训练。这样的做法可以节省时间,因为模型在实际训练之前已经知道了面部应该是什么样的。但请注意,预训练模式应该在开始实际数据的训练之前禁用。如果使用-D架构变种的模型,则必须进行预训练,而且强烈建议对所有模型进行预训练。预训练模型的数据可以在用户分享的SAEHD模型中找
————————————————————————————————————————————————————



什么是参数?
参数是控制模型结构与模型训练方法的一些值

所有参数中,有些参数只在第一次创建模型时可调整,一旦确定后不可更改。有些参数可以在后续训练中随时调整。

就好比造大厦,一旦决定造几层楼,每层有几间房间,就不可再次变更。而而大厦内部怎么装修,时可以有你自行决定并随时变更的。

怎么输入/调节参数?
第一次运行时,会让你输入各个参数值,输入方法如下:

Which GPU indexes to choose? :请输入GPU序号

问句前的表示你直接按回车后,会使用的默认值你可以自行输入值,值的可选项通常在问句中会给出
如果不了解这个选项的作用,输入英文问号?按回车,会给出详细说明

当模型创建后,第N次执行训练脚本时,选择好模型和GPU后,短暂停顿后会有一行提示“Press enter in 2 seconds to override model settings”“请在2秒内按enter回车以重新修改模型参数设置”就是字面意思。如果2秒内没按enter,就会沿用上一次训练时的参数进行训练

接下来就解释各参数的作用,带*的一旦创建不可更改

0. 选择/创建模型
Choose one of saved models, or enter a name to create a new model.选择一个已有的模型,或输入名字创建新模型
: rename/输入r后回车 选择重命名模型
: delete/输入d后回车 选择删除模型

: liaef-ud512 - latest/输入0后回车 选择liaef-ud512这个模型

介绍:如果model文件夹内已经有模型,在这里会显示出来,如上面的 : liaef-ud512 - latest,-latest表示这是最近一个进行过训练的模型。如果你要使用已存在的模型,输入模型前的编号。如果要新建模型,直接输入新模型名字后按回车。

1. 选择训练用GPU
Choose one or several GPU idxs (separated by comma).选择一个或多个GPU序号,用英文逗号隔开
: CPU

: GeForce RTX 3090

Which GPU indexes to choose? :请输入GPU序号

介绍:第一次运行时首先会出现上面这段文字。要求你输入用于训练模型的GPU序号。可支持的序号已经给你列出来了,输入CPU就使用CPU训练,输入0就使用你的第一张显卡训练。土豪有多张显卡的话输入0,1,2,3.....
问句前面的代表默认值,即直接按回车会采用的值

推荐值:推荐只用编号为0的GPU训练。CPU速度太慢,直接放弃。有多张GPU的话,卡间通讯会消耗大量时间,如无必要不推荐多卡同时训练。

2. 选择自动备份时间
Autobackup every N hour每N小时备份 ( 0..24 ?:help ) :

介绍:自动备份会每隔N小时复制一份模型文件,以免模型崩溃后没法回退。0表示不自动备份

推荐值:6-12

3. 记录保存预览图
Write preview history ( y/n ?:help ) :
介绍:每次迭代会随机保存一张当前训练效果图,方便你查看模型进步效果,来判断是否已经训练到顶峰了。图片保存在model内一个以history结尾的文件夹中

推荐值:n 一般人看预览窗口的图就OK了。这个功能给做专业对比测试的用

4. 指定预览图
Choose image for the preview history ( y/n ) :

介绍:指定一张图片作为保存的历史预览图。选n就随机选一张

推荐值:n

5. 目标迭代次数
Target iteration目标迭代数 :

介绍:模型训练迭代次数,到了这个次数就停止训练。选0就一直会训练下去,直到你手动停止

推荐值:0

6. 随机翻转人脸
Flip faces randomly ( y/n ?:help ) :

介绍:图片随机左右翻转,以增多数据。src图不足时可以开,但更好的方式是增加数据。如果遇到src人脸左右不对称,比如一边有痣,一边没痣,那么开启后会导致练出来的人脸两边都会有若隐若现的痣。不推荐开,增加数据集是王道

推荐值:n

7.批尺寸大小
Batch_size ( ?:help ) : ?

介绍:每次迭代程序会随机选batchsize张图来学习,数量越大模型每次进步的方向越准,单次迭代时间也越久,需要的显存也相应成倍增加

推荐值:4-16 通常显存不足报错后,把这个值改低就好

8. 模型分辨率*
Resolution ( 64-640 ?:help ) :

介绍:模型生成人脸的分辨率。注意,这个只是尺寸大,并不是更清晰。大尺寸的结果就是训练速度更慢,通常256足够用了。一般人连256都训练不到高清,完全没必要用256以上的分辨率模型。

推荐值:128-256,要是16的倍数

9. 选择人脸类型*
Face type人脸类型 ( h/mf/f/wf/head ?:help ) :

介绍:训练用的人脸类型。什么是人脸类型呢,就是从原图中截取的人脸框大小。h是half face,mf是mid-half-face,f是full-face,wf是whole-face,head是最大的带整个头的人脸。

人脸越大,最后合成环节的可调节余地越大。但相同模型分辨率下,有效面积就越小。比如256尺寸的wf,有效的人脸范围大概只有二分之一大。但在显存越来越大的今天,不用担心。
h是deepfake刚问世时的人脸类型,当年显存小啊,只能将就将就。

推荐值:推荐用wf,已经把整个脸都包含进了,而且能兼容f人脸素材。 h和mf太小,在后期合成时没调整余地。head过大,没必要浪费显存。
许多人总问head模型,真没必要。我理解你们是觉得head可以把脸型也生成出来,这个wf就行,但实际上合成时用的还是dst的人脸轮廓,你训练阶段能生成没卵用。脸型问题你就认为无解吧,只能靠专业后期调整,别再讨论head模型了。

10. 模型的架构*
AE architecture ( ?:help ) :

介绍:模型的核心架构类型。有DF和LIAE两种架构。内容较多,具体区别细节以后单独开教程。这里你只要记住结论DF五官结构保留的更像,LIAE光影处理的更好。
除了核心架构外,还有几个附带参数可加,-u增加人脸相似度,-d在相同显存占用量下,牺牲速度换取分辨率.
核心架构和附带参数可组合使用,如 df, liae, df-d, df-ud, liae-ud

推荐值:LIAE系列

11. 模型中间瓶颈层的宽度
AutoEncoder dimensions ( 32-1024 ?:help ) :

介绍:模型最中间一层神经元的数量。可以理解为越大这个模型能力越强,但要求的显存也越大。就像大脑,人脑比猪脑神经元更多,能力也越强,但需要的头骨容量也越大。

推荐值:256及以上

12. 模型编码层的宽度
Encoder dimensions ( 16-256 ?:help ) :

介绍:模型前半部分神经元的数量。可以理解为越大这个模型能力越强,但要求的显存也越大。就像大脑,人脑比猪脑神经元更多,能力也越强,但需要的头骨容量也越大。

推荐值:64及以上

13. 模型解码层的宽度
Encoder dimensions ( 16-256 ?:help ) :

介绍:模型后半部分神经元的数量。可以理解为越大这个模型能力越强,但要求的显存也越大。就像大脑,人脑比猪脑神经元更多,能力也越强,但需要的头骨容量也越大。

推荐值:64及以上

14. 模型解码器遮罩层宽度
Decoder mask dimensions ( 16-256 ?:help ) :


介绍:模型中有个分支是学习遮罩,次此参数控制此部分的宽度。

推荐值:三分之一解码层宽度

15. 只训练遮罩部分
Masked training ( y/n ?:help ) :

介绍:只有人脸类型是wf或head时可选。开启后模型只关注于被遮罩划分出来的人脸,不学习遮罩外的无关区域。这个遮罩需要提前用xseg模型应用得到。不然默认使用人脸关键点围合而成的遮罩,会把头发等其他区域给囊括进来。

推荐值:y

16. 眼部嘴部优先训练
Eyes and mouth priority ( y/n ?:help ) :

介绍:眼神和嘴巴口型是最难训练的区域,开启这个参数可以让模型重点优化眼部和嘴部。但如果你没有闭眼素材和张嘴素材,开这个参数也没用

推荐值:n

17. 均匀化样本中各角度的素材
Uniform yaw distribution of samples ( y/n ?:help ) :

介绍:一般样本中正脸图片居多,俯仰脸侧脸数量较少,这会导致纯随机选取样本时,这些大角度素材被选中训练的概率较小,模型对它们的学习不足。开启此参数后,会根据人脸角度来挑选素材,让大角度人脸样本得到较好的训练

推荐值:n 看你的目标视频,如果有很多大角度的话,建议开启

18. 记录保存预览图
Write preview history ( y/n ?:help ) :

介绍:每次迭代会保存一张当前训练效果图,方便你查看模型进步效果,来判断是否已经训练到顶峰了。图片保存在model内一个以history结尾的文件夹中

推荐值:n 一般人看预览窗口的图就OK了。这个功能给做专业对比测试的用

19. 把模型和优化器放到GPU中使用
Place models and optimizer on GPU ( y/n ?:help ) :

介绍:开启后模型权重会放在GPU上使用,减少GPU和内存通信,从而提高训练速度。显存足够就开启,显存不够就关闭

推荐值:y

20. 使用AdaBelief优化器
Use AdaBelief optimizer? ( y/n ?:help ) :

介绍:使用最新的adabelief优化器作为训练用的迭代方法。模型收敛到最优状态的速度更快,效果更好。但会占用更多显存

推荐值:y

21. 使用学习率衰减
Use learning rate dropout ( n/y/cpu ?:help ) :

介绍:学习率可以简单理解每次模型进化的步子大小。步子大了容易扯着蛋,走上歧途。步子小了可以更精准走到正确的地点,但速度就慢。

推荐值:前期不开,等你感觉画面很久没进步时开启。

22. 是否扭曲样本
Enable random warp of samples ( y/n ?:help ) :

介绍:开扭曲后,给模型增大学习难度,让模型得到更高难度的锻炼,学成后就更牛逼。不开的话容易src和dst互相影响,让生成的src像dst。

推荐值:y 前期开,后期可关闭

23. GAN(生成对抗学习)的强度
GAN power ( 0.0 .. 1.0 ?:help ) :

介绍:机器学习中有个很牛逼的算法叫GAN,能生成细节更丰富的图,眼睫毛都根根分明。但特别耗显存,高配玩家建议开启。开启后模型崩溃的概率会增大,一定要做好自动备份。

推荐值:低配0 高配0.1

24. GAN的感知域尺寸大小*
GAN patch size ( 3-640 ?:help ) :

介绍:GAN每次去辨别的区域大小,越大效果越好,显存也占用越多。

推荐值:分辨率/8

25. GAN的模型宽度*
GAN dimensions(4-512 ?:help):

介绍:类似模型编码层宽度,越大效果越好,显存也占用越多。

推荐值:16 显存大可酌情增加

26. 脸部明暗色彩学习强度
Face style power ( 0.0..100.0 ?:help ) :

介绍:让生成的人脸和原本的人脸在明暗色彩上更相似。

推荐值:初期不开,后期从0.001开始慢慢增加,不要开太大,0.01差不多了,这个很容易崩

27. 背景明暗色彩学习强度
Background style power ( 0.0..100.0 ?:help ) :

介绍:让生成的背景和原本的背景在明暗色彩上更相似。学背景干嘛,后面都是要扣掉的,没必要,不用开

推荐值:0

28. 对src做变色处理
Color transfer for src faceset ( none/rct/lct/mkl/idt/sot ?:help ) :

介绍:src素材通常光影不够丰富,开启这个参数后,可以每次对src素材做随机颜色变化,人为营造出各种光影色彩

推荐值:rct或lct

29. 使用梯度剪裁
Enable gradient clipping ( y/n ?:help ) :

介绍:梯度是什么,可以理解为每次模型更新的变化剧烈程度。开启此参数后,会把模型剧烈的变化给限制住,能极大避免模型崩溃。不然很可能遇到一次很奇怪的数据,导致模型瞬间爆炸,崩成一片纯色

推荐值:y 强烈建议开着,不会多消耗显存

30. 使用预训练模式
Enable pretraining mode ( y/n ?:help ) :

介绍:一体包软件在 _internal\pretrain_CelebA\faceset.pak 放了一份综合名人人脸数据,人种、光影、角度很丰富,开启此参数后,src和dst就会使用这份数据做为训练。让模型可以先做个通识教育。为你自己的特定数据学习打下良好基础。

推荐值:n 我个人不推荐用这种方式做预训练。个人推荐你把杂七杂八的图直接放到src的aligned和dst的aligned文件夹中训练就行,效果一模一样,还方便随时增删数据。




DeepFaceLab将在启用预训练时覆盖一些模型设置。

设置名称覆盖值
学习速率降落False
随机变形False
GAN0.0
随机HSV功率0.0
面部风格功率0.0
背景风格功率0.0
均匀偏航True
随机水平翻转SRC面孔集True
随机水平翻转DST面孔集True

模型训练设置 (SAEHD)


训练设置描述
每N小时自动备份(0-24)设置自动备份间隔。
写入预览历史(y / n)选择是否写入预览图像历史记录(每30次迭代)。
选择预览历史的图像(y / n)(条件:写入预览历史)开始训练时,您将被提示选择历史生成的预览图像。
目标迭代设置目标迭代以结束并保存训练。将其设置为0以进行不间断训练。
随机翻转SRC面部(y / n)随机水平翻转SRC面部集。涵盖更多角度,但面孔可能看起来不太自然。
随机翻转DST面部(y / n)随机水平翻转DST面部集。如果未启用SRC随机翻转,则使src->dst的泛化更好。
批量大小更大的批处理大小对神经网络的泛化效果更好,但可能会导致内存错误。手动调整此值以适应您的显卡。
分辨率(64-640)(固定)更高的分辨率需要更多的VRAM和训练时间。该值将调整为16和32的倍数以用于-d架构。
面部类型(h / mf / f / wf / head)(固定)半脸/中脸/全脸/整个脸/头。半脸具有更高的分辨率,但涵盖了更少的面颊区域。中脸比半脸宽30%。整个脸包括整个面部区域,包括额头。头覆盖整个头部,但需要为src和dst面部集使用XSeg。
AE架构(固定)“df”保留了更多的身份保留面部。“liae”可以修复过于不同的面部形状。“-u”增加了面部的相似性。“-d”(实验性)在相同计算成本下加倍分辨率。例如:df、liae、df-d、df-ud、liae-ud等。
自动编码器尺寸(32-1024)(固定)自动编码器尺寸。影响模型学习面部的总体能力。如果AE dims的数量不够,则例如闭眼可能不会被识别。更多dims更好,但需要更多的VRAM。您可以微调模型大小以适应您的GPU。
编码器尺寸(16-256)(固定)更多的dims有助于识别更多的面部特征并实现更清晰的结果,但需要更多的VRAM。您可以微调模型大小以适应您的GPU。
解码器尺寸(16-256)(固定)更多的dims有助于识别更多的面部特征并实现更清晰的结果,但需要更多的VRAM。您可以微调模型大小以适应您的GPU。
解码器掩码尺寸(16-256)(固定)典型的掩码尺寸=解码器尺寸/3。如果您从dst掩码中手动切出障碍物,则可以增加此参数以获得更好的质量。
掩膜训练(y / n)(条件:面部类型wf或head)此选项仅适用于“whole_face”或“head”类型。遮罩训练将训练区域剪裁到full_face遮罩或XSeg遮罩,因此网络将正确训练面部。
眼睛和嘴巴优先(y / n)帮助在训练过程中修复眼部问题,如“外星人眼睛”和眼睛方向错误。还使牙齿的细节更高。
样本的统一偏航分布(y / n)帮助修复由于面孔集中面部较少而导致的模糊侧面面孔问题。
模糊掩码(y / n)(条件:面部类型wf或head)模糊应用于训练样本的应用面掩码外部的附近区域。结果是面部附近的背景被平滑,与交换的面部相比不太明显。在src和dst面部集中需要确切的xseg掩码。
将模型和优化器放在GPU上(y / n)当您在一台GPU上进行训练时,默认情况下,模型和优化器权重会放在GPU上以加速该过程。您可以将其放在CPU上以释放额外的VRAM,从而设置更大的尺寸。
使用AdaBelief优化器?(y / n)使用AdaBelief优化器。它需要更多的VRAM,但模型的准确性和泛化性更高。
使用学习率丢失(n / y / cpu)当面部训练足够时,您可以启用此选项以获得额外的清晰度,并减少较少迭代的次数的子像素抖动。在禁用随机变形之前启用它,并在GAN之前启用它。n – 禁用;y – 启用;cpu – 在CPU上启用。这样可以不使用额外的VRAM,牺牲迭代的20%时间。
启用样本的随机变形(y / n)随机变形是为了泛化两个面孔的面部表情。当面孔训练足够时,您可以禁用它以获得额外的清晰度,并减少较少迭代的次数的子像素抖动。
随机色调/饱和度/光强度(0.0-0.3)应用于src面集的随机色调/饱和度/光强度。在神经网络的输入时,稳定面部交换期间的颜色扰动。通过选择src面集中最接近的颜色来减少颜色转移的质量。因此,src面集必须足够多样化。典型的良好值是0.05。
GAN功率(0.0-5.0)强制神经网络学习面部的小细节。只有在面孔足够训练了lr_dropout(开)和random_warp(关)时才启用它,不要禁用。值越高,出现问题的几率越高。典型的良好值是0.1。
GAN块大小(3-640)(条件:GAN功率)块大小越大,质量越高,需要的VRAM越多。即使在最低设置下,您也可以获得更锐利的边缘。典型的良好值是resolution / 8。
GAN尺寸(4-512)(条件:GAN功率)GAN网络的尺寸。尺寸越大,需要的VRAM越多。即使在最低设置下,您也可以获得更锐利的边缘。典型的良好值是16。
“真实面孔”功率(0.0000-1.0)(条件:DF架构)实验性选项。使结果面更像src面。值越高,歧视性越强。典型值为0.01。比较–
面部风格功率(0.0-100.0)学习预测面的颜色与掩码内的dst相同。如果要在“whole_face”中使用此选项,必须使用XSeg训练的掩码。警告:只在10k次迭代后启用它,当预测面足够清晰时开始学习样式。从0.001值开始并检查历史更改。启用此选项会增加模型崩溃的几率。
背景风格功率(0.0-100.0)学习预测面掩码外的区域与dst相同。如果要在“whole_face”中使用此选项,必须使用XSeg训练的掩码。整个脸您必须使用XSeg训练的掩码。这可以使面部更像dst。启用此选项会增加模型崩溃的几率。典型值为2.0。
src面集的颜色传输(none / rct / lct / mkl / idt / sot)更改src样本的颜色分布以接近dst样本。尝试所有模式以找到最佳模式。
启用渐变剪切(y / n)渐变剪切减少模型崩溃的机会,但牺牲训练速度。
启用预训练模式(y / n)预先训练大量各种面部。之后,可以更快地用于训练伪造的面孔。在禁用随机变形和GAN之前启用它。 n – 禁用;y – 启用。












meiyouruguo 发表于 2023-12-21 08:51:24

Part 3:

I changed my worklow.

When I do the SRC-SRC training and after that the SRC-PREtrainDST training it feels like go up some stairs and then go down to climb it a second time.

So i changed it to an training thats alternating.


SRC-SRC wit rw: on and lrd: off after that i switch to SRC-PretrainDST training with the same settings.

Then SRC_SRC with rw: on and lrd: on followd be the corrosponing SRC-PretrainDST training

SRC-SRC rw: off , lrd: off ------ SRC-PretrainDST

SRC-SRC rw: off , lrd: on ------ SRC-PretrainDST


After that I start the SRC-DST swap direct with rw: off ,lrd: on with not deleting any inters.

This feels more like staying on the same steps off the stairs instead of going up and down and ists working very good for me.

Johnny 发表于 2023-10-11 22:49:36

感谢分享

er232 发表于 2023-10-20 12:07:14

感谢楼主分享

草太阳 发表于 2023-11-2 12:27:45

签到攒灵石

13012355059 发表于 2023-11-11 22:29:26

感谢分享

安妮不安静 发表于 2023-11-12 10:58:28

认真学习中

gmemo 发表于 2023-12-6 14:33:50

感谢分享

青春不复返 发表于 2023-12-8 17:15:24

签到攒灵石

12491241 发表于 2023-12-30 08:51:31

感谢大佬
页: [1] 2 3
查看完整版本: DeepFaceLab中训练参数的详细解释