作者error405 (流河=L)
看板AI_Art
标题[情报] Luma Uni1 多模态推理 香蕉竞品
时间Tue Mar 24 10:08:36 2026
https://x.com/LumaLabsAI/status/2036107826498544110
Uni-1 相关资讯整理(基於 LumaLabsAI 官方贴文 + 官网 + 最新报导)
1. 基本介绍
发布时间:2026 年 3 月 23 日
官方标语:Less Artificial. More Intelligent.(更少人工、更智能)
定义:Luma 第一个 Unified Intelligence(统一智能) 模型,是一款「多模态推
理模型,能同时思考并生成像素」(multimodal reasoning model that thinks and
generates pixels simultaneously)。
核心概念:不再是「先理解提示 → 再生成图片」的分离流程,而是同一个模型、同
一个 forward pass 里就边想边画,更像真人思考过程。
官方试用连结:
https://lumalabs.ai/uni-1
(直接点进去就能免费试,API 即将开放,可加入 waitlist)
2. 三大核心特色(官方分成三个区块展示)
Intelligent(智能)
常识场景补全、空间推理、合理性驱动的转换(plausibility-driven)。
举例:能自动补完画面、理解物体空间关系、不会产生不合理的变形。
Directable(可指导)
参考图像引导生成 + 源头 grounded controls(完全锁定参考图的细节)。
适合角色一致性、风格转移、精准编辑。
Cultured(有文化)
文化感知生成,涵盖各种美学、迷因、漫画、日系、A24 电影风、编辑风等。
官方强调「不只生成,还懂文化脉络」。
3. 技术亮点(跟其他模型最大差异)
架构:Decoder-only autoregressive transformer(自回归,像 LLM 一样
token-by-token 生成)。
文字 + 图像用同一组权重、同一序列处理 → 没有「理解模型」跟「生成模型」分
家。
与传统 diffusion 模型(Midjourney、Stable Diffusion、Imagen 等)完全不同:
不是从噪声去噪,而是真正「边思考边画」。
好处:提示理解更强、逻辑推理更好、复杂编辑更稳定、能自我批判迭代(这也是
Luma Agents 的基础)。
4. 效能与排名(官方 + 第三方验证)
人类偏好 Elo 排名(最重要!):
Overall:第 1
Style & Editing:第 1
Reference-Based Generation:第 1
Text-to-Image:第 2(仅输 Google Nano Banana)
基准测试领先:
RISEBench(推理编辑)超越 Google Nano Banana 2 / Pro 与 OpenAI GPT
Image 1.5
ODinW-13(物件检测)几乎追平 Gemini 3 Pro
空间推理、逻辑推理大幅领先
价格优势(2K 解析度):
Text-to-Image:约 $0.09 / 张
编辑 / 多参考:$0.093~$0.11
比 Google Nano Banana 2 便宜 10-30%,高解析度企业使用更划算。venturebeat.com
5. 如何使用&目前状态
免费试用:直接去
https://lumalabs.ai/uni-1 或 Luma App
支援:纯文字提示、图像参考、多张参考、上传草图、连续对话迭代、Luma Agents
(代理人自动执行复杂任务)
API:即将开放(目前可加入 waitlist)
用户实际反馈(这则贴文底下超多):
「终於懂我想什麽了」
「提示不用再写小说,直接讲想法就好」
「角色一致性、风格、空间感直接起飞」
很多人拿来做漫画、角色表、产品图、A24 风格影片分镜,都说「差距明显」
6. 未来与定位
Uni-1 是 Luma 往「多模态通用智能(multimodal AGI)」的第一步。
後续会推出音讯、影片输出,完整 Luma Agents 平台已开始被广告公司(Publicis
、Adidas、Mazda)采用,能把原本一年 $1500 万的广告案压到 40 小时、不到 2 万美
元。
快速总结:
Uni-1 不是「又一个更好看的图模型」,而是第一个真正把『思考』跟『画图』合在一起
的模型。这也是为什麽大家说「感觉 AI 突然懂事了」。
--
Grok整理
自己登录试了下 写实风格图片能大到十几二十MB 3000X5000超大张 下面的是缩过
https://pbs.twimg.com/media/HEJCbggbcAA1h64.jpg
https://pbs.twimg.com/media/HEJCbgfbkAA3lES.jpg
https://pbs.twimg.com/media/HEJCbgjb0AAewJh.jpg
晚点看有没有介绍影片
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.36.237.182 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1774318121.A.87D.html
1F:→ error405: 还有它不给生loli 03/24 10:09
2F:推 ZMTL: 感谢分享,实测很厉害 03/24 11:23
3F:推 AoWsL: 喔 有看到消息 什麽Luma新出跟随语义的生图模型是不是?谢 03/24 11:50
4F:→ AoWsL: 谢分享.. 03/24 11:50
5F:→ sudekoma: 随便丢了张90年代赛璐路海报要它高清化 03/24 11:52
6F:→ sudekoma: 背景变逼真了,人物线条倒还是跟10年前的waifu2x一样糊 03/24 11:54
7F:推 zero790425: 这玩意不是拿来高清化的吧 03/24 13:00
8F:→ sudekoma: 可能我太认真看待说明文了 03/24 13:21
9F:→ sudekoma: 标榜能补完画面、风格移转、细节编辑 03/24 13:21
10F:→ sudekoma: 但是做不到高清化 03/24 13:22
11F:推 ZMTL: 高清化通常有单独的模型 03/24 13:23
12F:推 Supasizeit: DLSS5 03/24 17:39
13F:推 v86861062: 可以色色ㄇ 03/25 13:10
14F:→ Ning01: 可色色,但要神速截图,然後太多次帐号会被停用( 03/25 16:16
15F:→ Ning01: 真要色,大概要写插件从快取里存图,然後准备分身帐号大军 03/25 16:16
16F:→ error405: 额度每月回复 漫画又耗量大 已经玩不了了(倒 03/25 18:11
17F:→ error405: 结果也没有回复 04/11 14:39