AI_Art 板


LINE

这里要介绍的是Video Processor using dghs-imgutils专案 他是一个可处理多个动画影片 并依据UI介面设定的检测与分析方式 产出各角色图片的工具 经过人工筛选图片并加上tag後 可再用於训练SD LoRA模型 https://huggingface.co/spaces/avans06/ImgutilsVideoProcessor 因为专案放在huggingface免费空间,线上应该是无法直接执行 建议git clone到本机执行,python需要安装gradio与dghs-imgutils[gpu] 一部23分的影片依电脑等级不同,处理时间约350秒~1000秒之间 以香格里拉动画做测试,其执行结果例子如下 https://i.imgur.com/yQVWShF.png https://i.imgur.com/610d1rn.png ___ 底下说明下UI中各参数的用途 * 取样间隔 (毫秒) (Sample Interval (ms)) 设定从影片中撷取影格进行分析的时间间隔,单位是毫秒 (ms)。 ___ *人物侦测选项 (Person Detection Options) 启用人物侦测 (Enable Person Detection): 勾选後,程式会尝试在每个取样影格中侦测人物。 最小目标宽度 (影格宽度的百分比) (Min Target Width (% of Frame Width)): 设定被侦测到的人物必须达到的最小宽度(相对於完整影格宽度的百分比),才会被视 为有效目标进行後续处理。例如,0.25 代表人物宽度至少需达到影格宽度的 25%。 人物侦测模型 (PD Model): 选择用於人物侦测的预训练模型。不同的模型在速度和准确度上可能有所差异。 人物侦测信心度阈值 (PD Conf): 设定人物侦测的信心度阈值。只有当模型的预测信心度高於此值时,侦测结果才被接受 人物侦测 IoU 阈值 (PD IoU): 设定人物侦测中用於非极大值抑制 (NMS) 的交并比 (Intersection over Union) 阈值,用来过滤重叠的侦测框。 ___ *半身侦测选项 (Half-Body Detection Options) 启用半身侦测 (Enable Half-Body Detection): 勾选後,若「人物侦测」未启用或未侦测到人物,程式会在完整影格上尝试侦测 半身像。 使用半身像作为目标 (Use Half-Bodies as Targets): 若启用半身侦测,勾选此项会将侦测到的半身像裁切下来作为主要处理目标。 最小目标宽度 (影格宽度的百分比) (Min Target Width (% of Frame Width)): 设定被侦测到的半身像必须达到的最小宽度(相对於完整影格宽度的百分比), 才会被视为有效目标。 半身侦测模型 (HBD Model): 选择用於半身侦测的预训练模型。 半身侦测信心度阈值 (HBD Conf): 设定半身侦测的信心度阈值。 半身侦测 IoU 阈值 (HBD IoU): 设定半身侦测中用於 NMS 的 IoU 阈值。 ___ *脸部侦测选项 (Face Detection Options) 启用脸部侦测 (Enable Face Detection): 勾选後,程式会在已识别的主要目标(如人物或半身像)上进行脸部侦测。 裁切侦测到的脸部 (Crop Detected Faces): 若启用脸部侦测,勾选此项会将侦测到的脸部裁切下来并单独储存。 最小裁切宽度 (父影像宽度的百分比) (Min Crop Width (% of Parent Width)): 设定脸部裁切的最小宽度,此百分比是相对於其父影像(即人物或半身像的裁切图) 的宽度。 脸部侦测信心度阈值 (FD Conf): 设定脸部侦测的信心度阈值。 脸部侦测 IoU 阈值 (FD IoU): 设定脸部侦测中用於 NMS 的 IoU 阈值。 过滤未侦测到脸部的目标 (Filter Targets Without Detected Faces): 若勾选,则主要目标(如人物、半身像)如果未能在其上侦测到任何脸部,则该主要 目标将被过滤掉,不进行後续处理和储存。 ___ *头部侦测选项 (Head Detection Options) 启用头部侦测 (Enable Head Detection): 勾选後,程式会在已识别的主要目标上进行头部侦测。 裁切侦测到的头部 (Crop Detected Heads): 若启用头部侦测,勾选此项会将侦测到的头部裁切下来并单独储存(需满足最小宽度) 最小裁切宽度 (父影像宽度的百分比) (Min Crop Width (% of Parent Width)): 设定头部裁切的最小宽度,此百分比是相对於其父影像的宽度。 头部侦测模型 (HD Model): 选择用於头部侦测的预训练模型。 头部侦测信心度阈值 (HD Conf): 设定头部侦测的信心度阈值。 头部侦测 IoU 阈值 (HD IoU): 设定头部侦测中用於 NMS 的 IoU 阈值。 过滤未侦测到头部的目标 (Filter Targets Without Heads): 若勾选,则主要目标如果未能在其上侦测到任何头部,则该主要目标将被过滤掉。 ___ *CCIP 分类选项 (CCIP Classification Options) 启用 CCIP 分类 (Enable CCIP Classification): 勾选此项以启用 CCIP 特徵提取与分类。程式会根据图片内容的相似性将图片分到不同 的丛集(资料夹)中。资料夹会根据内部图片数量排序命名。 CCIP 模型 (CCIP Model): 选择用於 CCIP 特徵提取的模型。 CCIP 相似度阈值 (CCIP Similarity Threshold): 设定 CCIP 分类的相似度阈值。两张图片的 CCIP 特徵向量差异小於此阈值时,被认为 属於同一个丛集。值越小,代表对相似度的要求越高。 ___ *LPIPS 聚类选项 (LPIPS Clustering Options) 启用 LPIPS 聚类 (Enable LPIPS Clustering): 勾选此项以启用 LPIPS 聚类。LPIPS 是一种衡量图片感知相似度的指标,用於将视觉上 相似的图片分组。如果 CCIP 分类已启用,LPIPS 聚类会在每个 CCIP 丛集内部进行;否 则,会在所有收集到的图片上进行全域聚类。 LPIPS 相似度阈值 (LPIPS Similarity Threshold): 设定 LPIPS 聚类的相似度阈值。两张图片的 LPIPS 距离小於此阈值时,被认为属於 同一个丛集。值越小,代表对相似度的要求越高。 ___ *美学分析选项 (Aesthetic Analysis Options) 启用美学分析 (动漫风格) (Enable Aesthetic Analysis (Anime)): 勾选此项以启用基於动漫风格的美学评分模型。分析结果(如 great, good, normal, low, worst)会作为标签加到图片档名的最前面。分析结果仅供参考不一定准确。 美学模型 (Aesthetic Model): 选择用於美学分析的预训练模型。 ___ 本专案有使用Gemini补助开发且功能设计概念参考了 cybermeow作者制作的anime_screenshot_pipeline专案 #1ZrgoSI5 (AI_Art) [AI] 练了个怕痛的模型 https://github.com/cyber-meow/anime_screenshot_pipeline anime_screenshot_pipeline是使用waifuc套件的command-line介面程式 ImgutilsVideoProcessor 是使用dghs-imgutils具有UI介面程式 上述两个专案核心套件(waifuc、dghs-imgutils)皆为DeepGHS团队开发设计的 https://github.com/deepghs PS. waifuc专案的核心套件是dghs-imgutils并重新包装改写 --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 223.140.7.212 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1746858440.A.EEE.html
1F:推 Supasizeit: 不错喔 直接丢ChatGPT 就可以生训练的tag了 05/10 15:18
2F:推 AoWsL: 越来越复杂了呢 05/11 07:37







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:Tech_Job站内搜寻

TOP