作者error405 (流河=L)
看板AI_Art
标题[闲聊] 一图练lora 轨迹追踪..新东西好多
时间Sun Dec 14 12:38:38 2025
https://www.youtube.com/watch?v=fpAbYRNxYPM
这部影片介绍了 2025 年 12 月当周发布的多项重大 AI 新闻与工具。以下是重点摘要:
重点 AI 模型与更新:
GPT-5.2 (OpenAI):被称为「最适合专业知识工作的模型」。在多项基准测试中超越
人类专家,特别擅长多步骤逻辑推理、代理编码 (Agentic coding) 以及处理超长文本(
如整个代码库或长篇文档),准确率极高。
Devstral 2 (Mistral):最新的开源编码模型系列,包含 123B 和 24B (Small) 两
个版本。在编码能力上接近 GPT-5.1 和 Gemini 3 Pro 等闭源模型,适合在消费级 GPU
上运行。
Gemini 2.5 Text-to-Speech (Google):Google 更新了其语音生成模型,增强了表
现力、语气丰富度及对风格提示的遵循度,能更自然地控制语速和情感。
GLM-4.6V (智谱 AI):具备原生工具使用能力的多模态模型(Vision Agent)。能自
主浏览网页、分析文档、解析影片内容,甚至将网页截图转换为 HTML 代码。提供适合本
地运行的 Flash 版本。
影片与图像生成/编辑工具:
Wan-Move (阿里云):透过在起始帧绘制轨迹来精确控制影片中物体的移动路径,甚
至能控制摄影机运镜(如推拉摇移),效果优於 Kling 1.5 Pro。
Light-X:能改变现有影片的「摄影机运镜」和「光影效果」。例如将影片重新打光
(如日落光线)或改变视角,还能将人物合成到新背景并自动调整光影。
TwinFlow:极速图像生成技术。能将扩散模型的生成步数缩减至仅需「1 步」,速度
比传统方法快数十倍,且品质相当。
EgoEdit (Snapchat):实时影片编辑 AI。只需输入提示词(如「把水变成岩浆」)
,即可在极低延迟下实时修改影片内容,适用於 AR 眼镜等场景。
OneStory (Meta):能根据提示词或图片生成多个「连贯」的影片片段,保持角色、
场景和物体在不同镜头间的一致性,适合制作长篇故事。
Saber:影片参考物体插入工具。能将图片中的人物或物体无缝且一致地插入到影片
中,在保持角色特徵方面表现优异。
StereoWorld:将普通影片转换为具备深度感知的 3D 立体影片(需配戴 3D 眼镜观
看),在视觉品质和几何一致性上表现领先。
其他实用 AI 工具:
Window Seat:专门用於去除照片中窗户反光的 AI,效果优於现有工具,能还原清晰
的窗外景色。
AutoGLM (智谱 AI):能自主操作手机的 AI Agent。可依指令自动执行跨 App 操作
,如在外送平台点餐、在地图导航或发送讯息。
Qwen Image i2L:极速 LoRA 训练工具。仅需一张图片即可在几秒钟内训练出特定风
格或角色的 LoRA 模型。
MoCA:3D 模型生成器,能从图片生成复杂的 3D 物体并将其分解为可编辑的部件(
如将恐龙模型拆解为头、身体、四肢)。
MoCap Anything:从影片中捕捉任何对象(人类、动物甚至鱼类)的动作,并将其动
作迁移到其他模型上(例如让老鹰模仿鳄鱼的动作)。
NewBie Image:专为生成动漫风格优化的轻量级图像模型 (3.5B),适合在低阶设备
运行。
RealGen:透过「检测器奖励机制」训练的图像模型,专注於生成极度逼真的照片级
图像。
这周的 AI 进展非常迅速,涵盖了从基础大模型、影片编辑到手机自动化操作等多个领域
。
--
闲来看个AI新闻 发现东西多到看不完 乾脆丢给AI整理
gemini整理的又比grok更详细点
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.136.195.152 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1765687120.A.FFD.html
1F:推 lemondog: 他这个工作流使用的编程刚好是最近我在使用的 5.2 +mist 12/14 13:25
2F:→ lemondog: ral本地+glm4.6+gem3 pro preview,交叉使用去开发软件 12/14 13:25
3F:→ lemondog: 和网站功能最适合不过,最好也运用aws+gcp服务落地会更 12/14 13:25
4F:→ lemondog: 舒服 12/14 13:25
5F:推 Supasizeit: 5.2 连个Jupyter Notebook都生不好 不过应该是canvas 12/14 13:30
6F:→ Supasizeit: 的问题多一些 12/14 13:30
8F:→ error405: 用在固定形状物体可能好点 12/14 17:05
9F:推 AoWsL: 有稍微试用过...蛮难用的 跟我想的可能不太一样 12/15 16:50
10F:→ AoWsL: 原本想做一个侧翻效果 12/15 16:50