AI_Art 板


LINE

https://www.youtube.com/watch?v=JxrVtFER1Q8
這部影片介紹了許多本週(2025年12月21日左右)發布的 AI 新技術與模型,內容相當豐 富。以下是各項新東西的詳細簡介: 核心大模型與開源模型 Xiaomi MiMo V2 Flash (小米): 被稱為目前最強的開源模型,在 Agentic Coding(代理編碼)和推理任務上表 現超越了 DeepSeek 和 Kimi k2 Thinking。 這是一個混合專家模型 (MoE),總參數 309B,但在運行時僅激活 15B,因此效 率極高。 在多個基準測試(如 SWE-bench Verified)中表現接近 GPT-5 和 Claude 4.5 等閉源模型。 Gemini 3 Flash (Google): Google 發布的高效率模型,是目前性價比最高的選擇。 速度比 Gemini 2.5 Pro 快 3 倍,成本僅為 Gemini 3 Pro 的四分之一,但性 能依然強大,在 Artificial Analysis 排行榜上名列第二(僅次於 GPT-5.2 和 Gemini 3 Pro)。 具備 100 萬 token 的上下文窗口,並在多模態(影像、音訊理解)表現出色。 影片生成與編輯工具 Hunyuan World 1.5 (Tencent): 一個即時 (Real-time) 3D 世界生成器。 不像傳統遊戲是預先設計好的,它是隨著你的移動(使用 WASD 鍵)即時生成場 景。 支援透過提示詞即時改變環境(例如「木頭冒煙」、「城堡失火」、「遠處爆炸 」)。 已開源,且硬體需求相對較低(只需 14GB VRAM)。 SeaDance 1.5 Pro (ByteDance): 字節跳動推出的影片生成模型,被評價為比 Alibaba 的 Wan 2.6 更強。 在影片一致性、美學和動作流暢度上表現優異,且支援生成帶有音訊的影片。 Wan 2.6 (Alibaba): Wan 2.5 的小幅升級版,新增了 Reference to Video 功能(可上傳參考影片來 生成新影片)。 雖然支援音訊生成,但在整體表現上被評價為不如 SeaDance 1.5 Pro,且目前 似乎是閉源的。 RealVideo (Zhipu AI / GLM Team): 即時人物說話影片生成器。 能根據輸入的文字和一張照片,即時生成說話的 Avatar 影片,延遲僅約 2 秒 。 已開源,基於 CogVideoX 模型架構。 Long V2: 專門解決 AI 影片長度限制的問題,能生成長達 5 分鐘 的超長影片,且保持場 景連貫性(大多現有模型僅能生成 10 秒左右)。 已開源,支援在消費級 GPU 上運行(需 14GB VRAM)。 Turbo Diffusion: 一個加速工具,能將本地影片生成速度提升 100 到 200 倍。 例如生成 5 秒影片僅需 2 秒(原先可能需數分鐘),且幾乎不犧牲畫質。 已開源,適用於 Wan 2.1/2.2 等模型。 Ray 3 Modify (Luma Labs): 強大的影片重繪/修改工具。 能將現有影片轉換風格(如夜間模式、冬季),或無縫替換影片中的角色( Character Swap),甚至能將你自己演出的影片轉換為電影場景。 EgoX: 能將第三人稱視角的影片轉換為第一人稱視角 (Egocentric) 的 AI。 例如將一段踢球的影片,轉換成「你自己正在踢球」的主觀鏡頭。 圖像與 3D 生成 Trellis 2 (Microsoft): 強大的開源 3D 模型生成器,從單張圖片即可生成極高品質、細節豐富的 3D 模 型(包括毛髮、複雜結構)。 採用了獨特的 "Oxels" 技術(結合幾何與材質的 3D 像素)。 Stereo Space: 能將普通 2D 照片轉換為 3D 立體照片(需配戴紅藍 3D 眼鏡觀看,或使用交叉 眼觀看法)。 能生成具有深度感的立體場景。 Qwen Image Layered (Alibaba): 能將一張圖片拆解為多個透明圖層(類似 Photoshop 的圖層)。 允許你單獨編輯背景、角色或文字,而不影響其他部分。 SVG Text-to-Image (Kling): 一種不使用 VAE (變分自編碼器) 的新型圖像生成架構,直接在視覺空間生成圖 像。 雖然目前是實驗性質,但證明了不依賴 Latent Space 也能生成不錯的圖像。 Flux 2 Max (Black Forest Labs): Flux 系列最強模型,但在發布當天剛好撞上 OpenAI 的 GPT Image 1.5,且在 評測中略遜於 GPT Image 1.5 和 Nano Banana Pro (Google Imagen 3)。 角色動畫與 Avatar Scale: 目前最強的開源角色動畫工具。 能將參考影片中的動作(甚至複雜的迴旋踢、跳舞)完美遷移到任何角色(包括 動物、動漫人物)身上,且支援多角色同時動畫化。 透過提取 3D 姿勢 (3D Pose) 而非僅 2D 姿勢來提高準確度。 LongCat Video Avatar (Meituan): 開源的照片轉說話/唱歌影片工具。 只需一張照片 + 音訊,就能生成極其自然、表情豐富(甚至能大笑、呼吸)的 影片,被認為是目前該領域最強的開源工具。 其他工具 VRBGX (Adobe): 影片材質編輯工具。能將影片分解為 Albedo(顏色)、Normal(表面紋理)、 Material(材質)和 Irradiance(光照)四個屬性,並允許你單獨修改它們(例如把沙 發改成金屬材質,或改變影片的光照環境)。 這週的 AI 進展涵蓋了從基礎模型、3D 生成、即時互動世界到影片編輯的全方位突破, 且許多強大的工具(如 Xiaomi MiMo, Trellis 2, Scale)都是開源的。 -- Gemini整理 一直進步一直爽 --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.136.198.21 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/AI_Art/M.1766289972.A.71B.html
1F:→ error405: 嗯 他說讓wan2.2快一百倍? 12/21 12:12
2F:推 Supasizeit: 那是沒開任何加速下比 12/21 14:09
3F:→ necrophagist: 覺得吹太大 12/21 14:49
4F:推 patvessel: 看了一下 應該是self forcing機制 12/21 16:58
5F:→ patvessel: 說不犧牲畫質..對但是也不對 因為會變成別的東西 12/21 16:58
6F:→ patvessel: 而不是降低畫質 12/21 16:58
7F:推 patvessel: 從範例影片就能看的出來試用後的結果和原本的影片幾乎 12/21 17:06
8F:→ patvessel: 完全不同 而且運鏡和動態範圍縮減 12/21 17:06
9F:→ patvessel: 這就是Self-forcing的特點之一 可能還他配蒸餾和其他 12/21 17:07
10F:→ patvessel: 注意力加速或量化手段 12/21 17:07







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:e-shopping站內搜尋

TOP