AI_Art 板


LINE

這裡要介紹的是Video Processor using dghs-imgutils專案 他是一個可處理多個動畫影片 並依據UI介面設定的檢測與分析方式 產出各角色圖片的工具 經過人工篩選圖片並加上tag後 可再用於訓練SD LoRA模型 https://huggingface.co/spaces/avans06/ImgutilsVideoProcessor 因為專案放在huggingface免費空間,線上應該是無法直接執行 建議git clone到本機執行,python需要安裝gradio與dghs-imgutils[gpu] 一部23分的影片依電腦等級不同,處理時間約350秒~1000秒之間 以香格里拉動畫做測試,其執行結果例子如下 https://i.imgur.com/yQVWShF.png https://i.imgur.com/610d1rn.png ___ 底下說明下UI中各參數的用途 * 取樣間隔 (毫秒) (Sample Interval (ms)) 設定從影片中擷取影格進行分析的時間間隔,單位是毫秒 (ms)。 ___ *人物偵測選項 (Person Detection Options) 啟用人物偵測 (Enable Person Detection): 勾選後,程式會嘗試在每個取樣影格中偵測人物。 最小目標寬度 (影格寬度的百分比) (Min Target Width (% of Frame Width)): 設定被偵測到的人物必須達到的最小寬度(相對於完整影格寬度的百分比),才會被視 為有效目標進行後續處理。例如,0.25 代表人物寬度至少需達到影格寬度的 25%。 人物偵測模型 (PD Model): 選擇用於人物偵測的預訓練模型。不同的模型在速度和準確度上可能有所差異。 人物偵測信心度閾值 (PD Conf): 設定人物偵測的信心度閾值。只有當模型的預測信心度高於此值時,偵測結果才被接受 人物偵測 IoU 閾值 (PD IoU): 設定人物偵測中用於非極大值抑制 (NMS) 的交並比 (Intersection over Union) 閾值,用來過濾重疊的偵測框。 ___ *半身偵測選項 (Half-Body Detection Options) 啟用半身偵測 (Enable Half-Body Detection): 勾選後,若「人物偵測」未啟用或未偵測到人物,程式會在完整影格上嘗試偵測 半身像。 使用半身像作為目標 (Use Half-Bodies as Targets): 若啟用半身偵測,勾選此項會將偵測到的半身像裁切下來作為主要處理目標。 最小目標寬度 (影格寬度的百分比) (Min Target Width (% of Frame Width)): 設定被偵測到的半身像必須達到的最小寬度(相對於完整影格寬度的百分比), 才會被視為有效目標。 半身偵測模型 (HBD Model): 選擇用於半身偵測的預訓練模型。 半身偵測信心度閾值 (HBD Conf): 設定半身偵測的信心度閾值。 半身偵測 IoU 閾值 (HBD IoU): 設定半身偵測中用於 NMS 的 IoU 閾值。 ___ *臉部偵測選項 (Face Detection Options) 啟用臉部偵測 (Enable Face Detection): 勾選後,程式會在已識別的主要目標(如人物或半身像)上進行臉部偵測。 裁切偵測到的臉部 (Crop Detected Faces): 若啟用臉部偵測,勾選此項會將偵測到的臉部裁切下來並單獨儲存。 最小裁切寬度 (父影像寬度的百分比) (Min Crop Width (% of Parent Width)): 設定臉部裁切的最小寬度,此百分比是相對於其父影像(即人物或半身像的裁切圖) 的寬度。 臉部偵測信心度閾值 (FD Conf): 設定臉部偵測的信心度閾值。 臉部偵測 IoU 閾值 (FD IoU): 設定臉部偵測中用於 NMS 的 IoU 閾值。 過濾未偵測到臉部的目標 (Filter Targets Without Detected Faces): 若勾選,則主要目標(如人物、半身像)如果未能在其上偵測到任何臉部,則該主要 目標將被過濾掉,不進行後續處理和儲存。 ___ *頭部偵測選項 (Head Detection Options) 啟用頭部偵測 (Enable Head Detection): 勾選後,程式會在已識別的主要目標上進行頭部偵測。 裁切偵測到的頭部 (Crop Detected Heads): 若啟用頭部偵測,勾選此項會將偵測到的頭部裁切下來並單獨儲存(需滿足最小寬度) 最小裁切寬度 (父影像寬度的百分比) (Min Crop Width (% of Parent Width)): 設定頭部裁切的最小寬度,此百分比是相對於其父影像的寬度。 頭部偵測模型 (HD Model): 選擇用於頭部偵測的預訓練模型。 頭部偵測信心度閾值 (HD Conf): 設定頭部偵測的信心度閾值。 頭部偵測 IoU 閾值 (HD IoU): 設定頭部偵測中用於 NMS 的 IoU 閾值。 過濾未偵測到頭部的目標 (Filter Targets Without Heads): 若勾選,則主要目標如果未能在其上偵測到任何頭部,則該主要目標將被過濾掉。 ___ *CCIP 分類選項 (CCIP Classification Options) 啟用 CCIP 分類 (Enable CCIP Classification): 勾選此項以啟用 CCIP 特徵提取與分類。程式會根據圖片內容的相似性將圖片分到不同 的叢集(資料夾)中。資料夾會根據內部圖片數量排序命名。 CCIP 模型 (CCIP Model): 選擇用於 CCIP 特徵提取的模型。 CCIP 相似度閾值 (CCIP Similarity Threshold): 設定 CCIP 分類的相似度閾值。兩張圖片的 CCIP 特徵向量差異小於此閾值時,被認為 屬於同一個叢集。值越小,代表對相似度的要求越高。 ___ *LPIPS 聚類選項 (LPIPS Clustering Options) 啟用 LPIPS 聚類 (Enable LPIPS Clustering): 勾選此項以啟用 LPIPS 聚類。LPIPS 是一種衡量圖片感知相似度的指標,用於將視覺上 相似的圖片分組。如果 CCIP 分類已啟用,LPIPS 聚類會在每個 CCIP 叢集內部進行;否 則,會在所有收集到的圖片上進行全域聚類。 LPIPS 相似度閾值 (LPIPS Similarity Threshold): 設定 LPIPS 聚類的相似度閾值。兩張圖片的 LPIPS 距離小於此閾值時,被認為屬於 同一個叢集。值越小,代表對相似度的要求越高。 ___ *美學分析選項 (Aesthetic Analysis Options) 啟用美學分析 (動漫風格) (Enable Aesthetic Analysis (Anime)): 勾選此項以啟用基於動漫風格的美學評分模型。分析結果(如 great, good, normal, low, worst)會作為標籤加到圖片檔名的最前面。分析結果僅供參考不一定準確。 美學模型 (Aesthetic Model): 選擇用於美學分析的預訓練模型。 ___ 本專案有使用Gemini補助開發且功能設計概念參考了 cybermeow作者製作的anime_screenshot_pipeline專案 #1ZrgoSI5 (AI_Art) [AI] 練了個怕痛的模型 https://github.com/cyber-meow/anime_screenshot_pipeline anime_screenshot_pipeline是使用waifuc套件的command-line介面程式 ImgutilsVideoProcessor 是使用dghs-imgutils具有UI介面程式 上述兩個專案核心套件(waifuc、dghs-imgutils)皆為DeepGHS團隊開發設計的 https://github.com/deepghs PS. waifuc專案的核心套件是dghs-imgutils並重新包裝改寫 --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.140.7.212 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/AI_Art/M.1746858440.A.EEE.html
1F:推 Supasizeit: 不錯喔 直接丟ChatGPT 就可以生訓練的tag了 05/10 15:18
2F:推 AoWsL: 越來越複雜了呢 05/11 07:37







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:WOW站內搜尋

TOP