[讨论] 从动画准备训练资料半自动流程

时间Wed Dec 21 18:40:06 2022

个人是个兴趣使然的模型训练师目前训练了不少dreambooth https://huggingface.co/alea31415/ 图也有丢pixiv (含18禁但这样能做到的成果差强人意鉴於别人来自深渊小书痴孤独摇滚等动画模型的成功经验 (有兴趣我晚点可以贴范例图 (有些真的几乎分不出来目前正在弄一个从动画自动抓图来训练的pipeline https://github.com/cyber-meow/anime_screenshot_pipeline 主要过程包括用ffmpeg自动截图并且先用简单filter去掉连续相近的scene 这样一集24分钟大概5000张图之後用neural network feature移除相似图片这样下来大概剩500张图因为专注於角色接着用face detector加脸资讯的metadata并且吧图片依照脸数量跟大小分到不同资料夹训练few shot classifier/tagger自己分类资料目前测试了用脸分类角色的classifier 一个角色给个10/20张图就可以训练不要太edge case的情况表现都不错缺点是只能分类正面跟一些侧面背面一开始face detector的部分就爆了这部分希望更好的few shot learning model 然後依照class分资料夹目前在用登山少女除了第三季都好了大概一万张图结果如下 https://imgur.com/a/vvqw7ve 自己有手动处理没侦测到的角色所以颇花时间然後再用别人训练好的tagger上tag (deepdanbooru, wd1.4tagger 或blip上caption 处理下来一张图的metadata如下 https://imgur.com/a/URm90YH fanart的部分如果用imgbrd-grabber从booru抓处理起来容易多了因为本身就有tag information TODO: 1. 从metadata随机生成训练用的caption 2. 利用资料夹结构调整每个子资料夹的权重实际就是生成一个multiply.txt目前只有Ever ydream(2)有支援 (我去discord做feature request当下他们就写好了 kohya teainer虽然有些feature比较好但感觉是自己在develop 因为我一定需要这个auto balance的功能所以可能只能用everydream 3. 收集更多额外的regularization dataset (某些想训练的concept图还不够 4. 训练目前everydream2有些bug 等他们修 5. 当全部弄好会加doc可能也会分享去西恰希望有兴趣的人可以一起帮助顺这个流程其他: https://github.com/huggingface/diffusers/pull/1585 比较好的inpainting演算法等善心人士帮我写成extension pipeline搞四天了还要回去写paper啊啊 -- 北欧组一生推 https://i.imgur.com/ydMoryp.jpg https://i.imgur.com/njHa0OA.jpg https://i.imgur.com/KVrWmNb.jpg https://i.imgur.com/leUc4jP.jpg https://i.imgur.com/aWFuDE4.jpg --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 81.185.165.158 (法国) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1671619211.A.58B.html ※ 编辑: cybermeow (81.185.165.158 法国), 12/21/2022 18:43:25

1^F：推 andyleeyuan: 有神快拜12/21 18:50

※ 编辑: cybermeow (81.185.165.158 法国), 12/21/2022 19:29:12

2^F：推 fragmentwing: 太神啦 12/21 20:57

3^F：推 aa1052v: 快推免得被发现我看不懂XD 12/22 11:57

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

AI_Art 板

[讨论] 从动画准备训练资料半自动流程

热门看板

赞助商连结