作者error405 (流河=L)
看板AI_Art
標題[閒聊] 一圖練lora 軌跡追蹤..新東西好多
時間Sun Dec 14 12:38:38 2025
https://www.youtube.com/watch?v=fpAbYRNxYPM
這部影片介紹了 2025 年 12 月當週發布的多項重大 AI 新聞與工具。以下是重點摘要:
重點 AI 模型與更新:
GPT-5.2 (OpenAI):被稱為「最適合專業知識工作的模型」。在多項基準測試中超越
人類專家,特別擅長多步驟邏輯推理、代理編碼 (Agentic coding) 以及處理超長文本(
如整個代碼庫或長篇文檔),準確率極高。
Devstral 2 (Mistral):最新的開源編碼模型系列,包含 123B 和 24B (Small) 兩
個版本。在編碼能力上接近 GPT-5.1 和 Gemini 3 Pro 等閉源模型,適合在消費級 GPU
上運行。
Gemini 2.5 Text-to-Speech (Google):Google 更新了其語音生成模型,增強了表
現力、語氣豐富度及對風格提示的遵循度,能更自然地控制語速和情感。
GLM-4.6V (智譜 AI):具備原生工具使用能力的多模態模型(Vision Agent)。能自
主瀏覽網頁、分析文檔、解析影片內容,甚至將網頁截圖轉換為 HTML 代碼。提供適合本
地運行的 Flash 版本。
影片與圖像生成/編輯工具:
Wan-Move (阿里雲):透過在起始幀繪製軌跡來精確控制影片中物體的移動路徑,甚
至能控制攝影機運鏡(如推拉搖移),效果優於 Kling 1.5 Pro。
Light-X:能改變現有影片的「攝影機運鏡」和「光影效果」。例如將影片重新打光
(如日落光線)或改變視角,還能將人物合成到新背景並自動調整光影。
TwinFlow:極速圖像生成技術。能將擴散模型的生成步數縮減至僅需「1 步」,速度
比傳統方法快數十倍,且品質相當。
EgoEdit (Snapchat):實時影片編輯 AI。只需輸入提示詞(如「把水變成岩漿」)
,即可在極低延遲下實時修改影片內容,適用於 AR 眼鏡等場景。
OneStory (Meta):能根據提示詞或圖片生成多個「連貫」的影片片段,保持角色、
場景和物體在不同鏡頭間的一致性,適合製作長篇故事。
Saber:影片參考物體插入工具。能將圖片中的人物或物體無縫且一致地插入到影片
中,在保持角色特徵方面表現優異。
StereoWorld:將普通影片轉換為具備深度感知的 3D 立體影片(需配戴 3D 眼鏡觀
看),在視覺品質和幾何一致性上表現領先。
其他實用 AI 工具:
Window Seat:專門用於去除照片中窗戶反光的 AI,效果優於現有工具,能還原清晰
的窗外景色。
AutoGLM (智譜 AI):能自主操作手機的 AI Agent。可依指令自動執行跨 App 操作
,如在外送平台點餐、在地圖導航或發送訊息。
Qwen Image i2L:極速 LoRA 訓練工具。僅需一張圖片即可在幾秒鐘內訓練出特定風
格或角色的 LoRA 模型。
MoCA:3D 模型生成器,能從圖片生成複雜的 3D 物體並將其分解為可編輯的部件(
如將恐龍模型拆解為頭、身體、四肢)。
MoCap Anything:從影片中捕捉任何對象(人類、動物甚至魚類)的動作,並將其動
作遷移到其他模型上(例如讓老鷹模仿鱷魚的動作)。
NewBie Image:專為生成動漫風格優化的輕量級圖像模型 (3.5B),適合在低階設備
運行。
RealGen:透過「檢測器獎勵機制」訓練的圖像模型,專注於生成極度逼真的照片級
圖像。
這週的 AI 進展非常迅速,涵蓋了從基礎大模型、影片編輯到手機自動化操作等多個領域
。
--
閒來看個AI新聞 發現東西多到看不完 乾脆丟給AI整理
gemini整理的又比grok更詳細點
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.136.195.152 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/AI_Art/M.1765687120.A.FFD.html
1F:推 lemondog: 他這個工作流使用的編程剛好是最近我在使用的 5.2 +mist 12/14 13:25
2F:→ lemondog: ral本地+glm4.6+gem3 pro preview,交叉使用去開發軟件 12/14 13:25
3F:→ lemondog: 和網站功能最適合不過,最好也運用aws+gcp服務落地會更 12/14 13:25
4F:→ lemondog: 舒服 12/14 13:25
5F:推 Supasizeit: 5.2 連個Jupyter Notebook都生不好 不過應該是canvas 12/14 13:30
6F:→ Supasizeit: 的問題多一些 12/14 13:30
8F:→ error405: 用在固定形狀物體可能好點 12/14 17:05
9F:推 AoWsL: 有稍微試用過...蠻難用的 跟我想的可能不太一樣 12/15 16:50
10F:→ AoWsL: 原本想做一個側翻效果 12/15 16:50