作者error405 (流河=L)
看板AI_Art
標題[分享] 各家圖轉影片效果比較
時間Sun May 11 10:01:17 2025
影片:
https://x.com/towya_aillust/status/1912098867136373206
Kling 2.0, Hailuo AI, Pixverse, Luma Ray2(Flash), Runway Gen4(Turbo)
讓同一個兔女郎在草原上跑步的比較
以下是請grok生的各家簡單介紹
--
1. Kling 2.0
簡介:由中國快手公司開發的 Kling 2.0 是一款頂尖 AI 影片生成工具,專注於圖片轉
影片與文字轉影片,強調流暢動作、高畫質與精準提示遵循,適合動態場景與單人角色影
片。
使用方式:
訪問 Kling 網站(www.klingai.com)或下載 iOS/Android 應用程式,註冊帳戶(
免費帳戶提供有限額度)。
上傳圖片(支持 JPG、PNG,檔案大小限 30MB),輸入文字提示詞(例如「角色在城
市飛翔」)。
選擇模式(標準或專業)、影片時長(5 或 10 秒)、解析度(最高 1080p)及攝影
機控制(平移、縮放等)。
點擊生成,生成時間約數分鐘(免費版較慢),下載 MP4 格式影片。
特色:
圖片轉影片表現卓越,動作流暢,細節保留佳(如單人動作或物體旋轉)。
提供創意與相關性滑桿,精細控制生成結果。
免費計劃含水印,付費計劃(價格未公開)解鎖專業模式與更高額度。
缺點:介面可能稍顯雜亂,免費版生成速度慢。
2. Hailuo AI
簡介:Hailuo AI(由 MiniMax 開發)是一款靈活的 AI 影片生成工具,支持圖片與文字
轉影片,以高真實感與多樣化場景著稱,適合製作動物、動作或現實場景影片。
使用方式:
訪問 Hailuo AI 網站(www.hailuoai.video),註冊帳戶(部分地區需 VPN)。
上傳圖片,輸入描述性提示詞(例如「狗在草原奔跑」)。
選擇影片時長(最長 10 秒)、解析度(最高 1080p)及風格模板(可瀏覽其他用戶
模板)。
生成影片(約 1-2 分鐘),下載 MP4 或直接分享。
特色:
支援動態場景生成,背景細節豐富,適合社群媒體與行銷。
提供大量預設模板,靈感易得,無需編輯技能。
缺點:動作偶爾不自然(如手部痙攣感),數據安全疑慮(中國模型)。
3. Pixverse
簡介:Pixverse 是一款功能豐富的 AI 影片生成工具,擅長將圖片轉為卡通、動漫或
3D 風格影片,提供高解析度(最高 4K)與多樣化特效,適合創意與藝術性內容。
使用方式:
訪問 Pixverse 網站(www.pixverse.ai)或透過 Discord 平台,註冊帳戶。
上傳圖片,選擇風格(動漫、3D、黏土等)及特效(如變形、爆炸)。
輸入提示詞,調整動作模式(正常或高效)、時長(5 或 10 秒)及攝影機控制。
生成影片(免費版有限額度),下載 MP4 或 GIF。
特色:
高解析度與詳細角色生成,動漫風格尤為出色。
提供獨特特效(如超級英雄變身)與模板化創作,適合快速品牌化。
缺點:動作有時偏慢,類似慢動作,介面對新手稍複雜。
4. Luma Ray2 (Flash)
簡介:Luma Labs 的 Ray2 (Flash) 是 Dream Machine 平台的最新模型,專注於高真實
感與快速生成,支持文字轉影片,圖片轉影片功能即將推出,適合電影化場景與專業故事
講述。
使用方式:
訪問 Luma AI 網站(www.lumalabs.ai),註冊帳戶。
上傳圖片(即將支持),輸入詳細提示詞(例如「汽車在山路上行駛」)。
選擇時長(最長 10 秒)、解析度(最高 1080p)及動作設定。
生成影片(生成時間因伺服器需求而異),下載 MP4。
特色:
物理交互逼真,動作流暢,適合動態場景(如車輛、動物)。
簡單介面,適合各技能水平用戶。
缺點:目前以文字轉影片為主,圖片轉影片功能尚未完全開放,生成速度偶爾不穩定
。
5. Runway Gen4 (Turbo)
簡介:Runway Gen4 (Turbo) 是 Runway 最新影片生成模型,專為快速生成高保真影片設
計,支持圖片與文字轉影片,適合專業創作者製作電影化或靜態場景。
使用方式:
訪問 Runway 網站(www.runwayml.com),註冊並選擇免費或無限計劃。
上傳圖片,輸入提示詞(例如「城市夜景時間流逝」)。
選擇 Gen4 (Turbo) 模式,設定時長(5 或 10 秒)、解析度(最高 1080p)及攝影
機控制。
生成影片(Turbo 模式約 1 分鐘),下載 MP4 或進一步編輯。
特色:
生成速度快,畫質細膩,適合動態轉場與人像場景。
提供進階工具(如唇同步、影片延伸),適合專業後期製作。
缺點:免費版有水印與解析度限制,提示詞偶爾被阻擋或拼寫錯誤。
總結比較
Kling 2.0:最佳圖片轉影片質量,動作流暢,適合單人或簡單場景,免費計劃性價
比高。
Hailuo AI:靈活且模板豐富,適合快速創作,但動作細節需改進。
Pixverse:動漫與特效強,適合創意內容,高解析度但動作稍慢。
Luma Ray2 (Flash):物理真實感佳,適合電影化場景,但圖片轉影片功能待完善。
Runway Gen4 (Turbo):專業工具,生成快速且功能全面,適合大規模項目,但成本
較高。
建議:若追求高品質與免費額度,Kling 2.0 是首選;若需動漫風格,Pixverse 表現突
出;若為專業用途,Runway Gen4 (Turbo) 提供最多控制選項。使用前可試用免費版,根
據需求選擇最適工具。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.207.183 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/AI_Art/M.1746928879.A.4E6.html
1F:→ error405: (新手筆記) 05/11 10:06
2F:→ error405: 開始爬雙葉AI版 先挖到了這個 05/11 10:12
※ 編輯: error405 (114.36.207.183 臺灣), 05/11/2025 10:20:14
3F:推 Supasizeit: 最近紅的是LTX跟Wan 05/11 10:22
4F:→ AoWsL: 喔..做影片你很有興趣嗎? 加臉書看就好了 05/11 10:23
6F:→ Supasizeit: Framepack是Hunyuan… 05/11 10:24
7F:→ AoWsL: 裡面很多會做測試 特別是最新的效果比較 05/11 10:25
※ 編輯: error405 (114.36.207.183 臺灣), 05/11/2025 10:25:42
8F:→ error405: 刪自己推文不犯法吧 05/11 10:26
10F:→ AoWsL: K2.0 05/11 10:26
12F:→ AoWsL: higgsfield ai 05/11 10:28
根據近期資訊與你的問題,提到的「LTX」與「Wan」應指兩款新興的 AI 圖片轉影片生成
模型,分別為 LTX Video 與 Wan 2.1,它們在 2024-2025 年間因高效能與高品質生成而
在 AI 影片創作領域受到矚目。以下是這兩款服務的簡單介紹,包含其功能、使用方式及
特色:
1. LTX Video
簡介:LTX Video(由 Lightricks 開發,最新版本 v0.9.5)是一款開源 AI 影片生成模
型,專為消費者級 GPU 優化,以極快的速度將圖片或文字轉為高品質影片,特別適合快
速製作社群媒體內容或創意短片。它的生成速度(5 秒影片僅需 4 秒)與流暢動作表現
使其在 2025 年備受關注。
使用方式:
訪問 LTX Video 的 GitHub 頁面(
https://github.com/Lightricks/LTX-Video)或
透過平台如 fal.ai、MimicPC 操作。
安裝模型(例如 LTX-Video v0.9.1,支援 RTX 4090 等 GPU,需 16-48GB VRAM)。
上傳圖片(建議 768x512 解析度,JPG/PNG 格式),輸入提示詞(例如「夜晚城市
縮時攝影」)。
調整參數(如幀數、種子值、CRF 壓縮值 20-40 以改善靜態問題),點擊生成。
影片生成後(約 4-17 秒,視硬體而定),下載 MP4 格式。
特色:
超快生成:5 秒 24 FPS 影片(768x512)僅需 4 秒,領先多數競爭者。
消費者級硬體支援:透過 bfloat16 優化,無需企業級設備,適合個人創作者。
流暢動作:擅長處理攝影機移動與過渡,減少 AI 常見的動作瑕疵。
缺點:對原始圖片品質敏感,需預處理(如透過 ffmpeg 壓縮)以避免靜態輸出;模
型仍處於 Beta 階段,偶爾品質不穩定。
2. Wan 2.1
簡介:Wan 2.1 是一款開源 AI 影片生成模型,基於擴散變換器(Diffusion
Transformers)與流匹配(Flow Matching)技術,以高品質圖片轉影片與文字轉影片生
成聞名。它超越其他開源模型(如 Hunyuan)與部分商業模型,在畫質與細節上表現出色
,適合動畫、電影化場景與複雜動作生成。
使用方式:
訪問 ThinkDiffusion 或 ComfyUI 平台(支援 Wan 2.1 模型,需下載
wan2.1_i2v_720p_14B_fp16.safetensors 等檔案)。
安裝 ComfyUI v0.3.26,載入模型(可從 Comfy.Org 或模型管理器下載)。
上傳圖片(建議 720p,JPG/PNG),輸入詳細提示詞(例如「星空下情侶剪影,草地
隨風搖曳」)。
設定時長(最長 10 秒)、解析度(最高 720p)及風格,點擊生成。
生成後(約數十秒至數分鐘,視硬體而定),下載 MP4 格式。
特色:
_
高畫質與細節:生成影片色彩鮮豔、照明逼真,適合動畫與電影化場景。
多語言支持:使用 T5 編碼器,理解多語言提示詞,生成靈活性高。
開源優勢:免費使用,模型可本地運行,適合開發者與創作者。
缺點:生成速度較 LTX Video 慢(非即時生成),對硬體要求較高(需 RTX 3090
或以上)。
總結比較
LTX Video:以速度取勝,生成 5 秒影片僅需 4 秒,適合需要快速產出流暢動作影
片的用戶(如社群媒體創作者)。其消費者級硬體支援降低使用門檻,但需圖片預處理以
確保品質。
Wan 2.1:畫質與細節更勝一籌,適合追求高品質動畫或電影化效果的創作者,但生
成速度較慢,對硬體要求更高。
建議:若你優先考慮快速生成與簡單操作,LTX Video 是最佳選擇,特別適合即時內容創
作;若追求畫質與創意表現,Wan 2.1 更適合需要精緻效果的項目。兩者皆為開源,可透
過免費平台試用,建議根據硬體條件與需求選擇。
備註:若你指的「LTX」或「Wan」並非上述模型(例如其他 AI 服務或公司,如 LXT AI
數據服務或 WAN-AI 網路分析平台),請提供更多背景資訊,我可進一步 提供精確介紹!
※ 編輯: error405 (114.36.207.183 臺灣), 05/11/2025 10:30:49
※ 編輯: error405 (114.36.207.183 臺灣), 05/11/2025 10:31:31
13F:→ AoWsL: 舊款LTX其實滿爛的 新版的那款進化很多 05/11 10:33
14F:→ AoWsL: 呃13B那款 05/11 10:34
17F:→ error405: 可愛小綠變阿桑跳舞啦 你他媽 05/11 10:52
19F:→ error405: ThinkDiffusion好像要錢 05/11 10:58
20F:→ AoWsL: GPT答案都寫的很模糊 特別你又是玩動漫 它根本不會告訴你動 05/11 10:59
21F:→ AoWsL: 漫適合什麼Ai影片 我先前好像提過 05/11 10:59
22F:→ AoWsL: 動漫跟做真實的Ai影片生成 還是有差 05/11 11:00
23F:→ AoWsL: PixVerse跟Wan就是那種通吃效果 05/11 11:02
25F:→ error405: 這個是runway 05/11 11:05
26F:→ AoWsL: 有一些寫起來蠻複雜的打360不見得有用 05/11 11:08
27F:→ AoWsL: 那是PixVerse給你的錯覺 你以為全部打360就會轉... 05/11 11:09
29F:→ error405: kling1.6感覺還不錯 可能還要改提詞 05/11 11:16
30F:→ error405: kling2.0貴五倍 先放置好了 05/11 11:17
31F:→ error405: 一個月就給166 生不了幾張 05/11 11:18
32F:→ AoWsL: K2.0 5秒就100點 10秒200點 一天才送70點根本沒免費額度 05/11 11:21
33F:→ AoWsL: higgsfield ai 免費額度一個月只有兩張 05/11 11:22
34F:→ error405: kling一天還有70的話那好像可以用 05/11 11:24
36F:→ error405: Hailuo 跑半天出不來 重新整理原來是太色不給生 05/11 11:31
37F:→ error405: Luma不給免費 放棄 05/11 11:35
38F:→ error405: 結果還是pixverse一天兩個穩定點嗎 05/11 11:36
39F:→ AoWsL: 海螺啊 一天3張 Wan平台版也可以用 05/11 11:37
40F:→ AoWsL: Vidu一個月20點 Q1沒得用 05/11 11:38
41F:→ AoWsL: K2.0高手在寫的 05/11 11:39
42F:→ AoWsL: 動漫用那個太浪費 05/11 11:39
43F:→ error405: 海螺是Hailuo嗎 禁色好像比pixverse還嚴 05/11 11:43
44F:→ AoWsL: 喔 對 海螺就對岸叫的意思就你講的 05/11 11:47
45F:→ error405: runway一個月625 差不多是25個五秒影片 05/11 12:06
46F:→ error405: 可是這微妙的效果多半沒法一次到位 05/11 12:06
47F:推 khara: 喔喔!有趣! 05/11 12:27
48F:→ khara: 是說我之前試過某個免費將圖片生成短片的網站: 05/11 12:27
49F:→ khara: 這是個初步結果: 05/11 12:27
51F:→ khara: 不過我當時試著意圖把某個打拳圖改成動態, 05/11 12:27
53F:→ khara: 但該免費網頁無法產生出拳打擊,只有收拳笑笑: 05/11 12:27
55F:→ khara: 但反正那也只是隨手搜到很陽春的簡單短片化。 05/11 12:27
56F:→ khara: 總之這次看看能否生成動態的出拳打擊的樣態了。 05/11 12:27
57F:→ AoWsL: 因為我不知道樓上用那個Ai影生成 下什麼提示喔 它捕捉不到 05/11 12:37
58F:→ AoWsL: 你畫面可能有幾個 1它對你提示詞沒有反應(提示詞錯誤 2它 05/11 12:37
59F:→ AoWsL: 在畫面看不見(所以它不會做 3它沒學習過(不知道如何做 05/11 12:37
60F:推 khara: 啊!好的。 05/11 13:40
61F:→ khara: 我試試1.用新工具;2.改善提示詞。感謝!:) 05/11 13:40
64F:→ AoWsL: Veo2 05/12 07:06
65F:→ error405: 嗯過一天K沒給70點啊 先放置了 05/12 08:49
66F:→ AoWsL: K70點應該是會員 05/12 10:13
67F:→ AoWsL: 我可能有點搞錯了 05/12 10:14
68F:→ AoWsL: 可能要查一下K它家費用 05/12 10:16
69F:推 khara: 哇!那個射箭的改短片太讚了! 05/12 13:13
70F:→ khara: 看來值得好好研究看看! 05/12 13:13
71F:→ AoWsL: 去google ai studio 提供Veo2額度 應該是一天免費兩張影片 05/12 13:45
72F:→ AoWsL: 長度在八秒 05/12 13:45
73F:→ AoWsL: 支援T2V跟I2V 05/12 13:47
74F:→ AoWsL: 射箭沒這麼簡單 很多都會做失敗 05/12 13:47
75F:→ AoWsL: Ai影片很多都做空手的 物件在畫面飛來飛去 你排不好 等等畫 05/12 13:57
76F:→ AoWsL: 面就爛掉了 05/12 13:57
77F:推 khara: 啊好吧!可以理解這難度。 05/12 19:55
78F:→ khara: AoWsL大製作出射箭圖真是太強了! 05/12 19:55
79F:→ khara: 我這種只是拿著玩的業餘用戶就先欣賞就好了。XD 05/12 19:55
80F:→ AoWsL: 我一開始也是免費影片用户 後續包了幾個付費平台 影片已經 05/12 20:48
81F:→ AoWsL: 練半年多了 不是講難度的問題 射箭這個動作在滿多平台都不 05/12 20:48
82F:→ AoWsL: 太好做 或做出來的效果很差 拿弓這個姿勢在AI群圖 不算太罕 05/12 20:48
83F:→ AoWsL: 見 但做的人很少 05/12 20:48
84F:→ AoWsL: >指影片做的人很少 05/12 20:49
85F:→ AoWsL: 影生字 05/12 20:56
87F:→ AoWsL: Grok3轉寫 05/12 20:57
89F:→ AoWsL: 私人秘方(文字潤飾 05/12 20:58
91F:→ error405: 寫小說對吧 05/12 21:04
92F:→ AoWsL: 影片提示詞就是寫小說啊 哈哈哈 05/12 21:04
93F:→ AoWsL: 抱歉我可能說的太籠統 寫影片比較像是 聞口令 清槍開始 然 05/13 08:50
94F:→ AoWsL: 後想辦法補足那中間所有細節動作 05/13 08:50
95F:→ AoWsL: 如果只是隨便做做一個畫面確實比較像寫小說啦 05/13 08:51
96F:→ AoWsL: 還是那句話 做影片很像駭客任務 你用文字去控制細節 05/13 08:54
99F:推 khara: 箭憑空消失!這特效也很帥!XD 05/16 13:17
100F:→ AoWsL: 並不是故意做消失 而是多物件同時移動>箭矢短暫飛行_弓臂 05/16 15:57
101F:→ AoWsL: 變化_弓弦變化 Veo2這個文字描述下去但畫面做不出來 只能靠 05/16 15:57
102F:→ AoWsL: 影片後製 對影片製作有經驗的可能更好做一點 05/16 15:57
105F:→ AoWsL: K2.0^ 05/16 16:13
106F:推 khara: 感謝說明!A大仔細的教學讓人獲益良多! 05/16 22:03