作者error405 (流河=L)
看板AI_Art
标题[闲聊] Illustrious Z 复杂指示理解能力提升
时间Thu Apr 16 09:09:23 2026
https://www.illustrious-xl.ai/blog/17
以下是根据官方部落格文章(
https://www.illustrious-xl.ai/blog/17)以及相关资讯
整理的 Illustrious Z 相关内容:
1. 什麽是 Illustrious Z?
Illustrious Z 是 Onoma Tech 开发的新一代 AI 图像生成模型,专注於动漫风格(Anime & Illustration
) 的高品质生成。
它不是延续之前的 Illustrious XL 系列(SDXL 架构),而是转向全新的
S3-DiT-based 架构(Diffusion Transformer 类型),目的是大幅提升复杂提示理解和
场景级(scene-level) 的构图能力,从「元素级生成」进化到「整体场景推理与组成」
。官方描述: “Illustrious Z is a newly developed model designed to extend
complex prompt understanding and scene-level illustration generation to a new
level.”
2. 主要特点与改进
更强的自然语言提示理解:能更好地处理长提示、叙事式描述、空间
关系和情绪氛围。
多角色构图与空间推理:在多人物场景中,能更准确维持位置关系、角色区分和属性一致
性,避免混乱或属性混合。
文字渲染(Text Rendering):文字更清晰、稳定,较少出现扭曲或错误字符。
支援两种提示方式:自然语言提示:输出更丰富、有上下文深度、电影感强(推荐用於复
杂场景)。
Tag-based 提示(类似 Danbooru tags):输出较快、直接,但线条较软、细节简化、风
格较平坦。
整体从「稳定性与控制」转向「理解与构图能力」。
与前代(Illustrious XL v3.5 / v3.6)相比:在复杂姿势、多角色、文字渲染上明显进
步。
但在纯角色焦点的稳定性、一致性和美学精炼上,v3.6 仍有优势(取决於使用情境)。
3. 技术规格
架构:S3-DiT-based(全新 Diffusion Transformer)
最佳解析度:1024×1024(目前最稳定)
训练基础:Fine-tuned on Z-image-turbo
训练资料截止时间:2026 年 1 月
4. 使用建议(来自官方范例)
推荐自然语言提示来发挥优势,例如描述姿势、空间关系
、情绪:单人复杂姿势范例:"She is performing a dancer pose: balancing on one
leg, with her other leg lifted and bent backward..."
多角色范例:"An illustration of narita top road from umamusume and lumine
from genshin impact..."(能较好维持角色身份与位置)
文字渲染范例:女孩拿着冰淇淋杯,上面印有 "onoma" 文字,能更准确呈现。
Tag-based 适合快速、简单控制。
目前可在 illustrious-xl.ai 官方平台直接使用(有 Illustrious-Z 选项),支援
Text-to-Image 和 Image-to-Image。
5. 目前状态与未来
模型仍在积极开发中,官方表示会继续改进角色一致性和输出稳定性。
部落格发布日期:2026 年 4 月 15 日(相当新)。
开发团队:Onoma Tech(前 Illustrious XL 系列也是他们开发,位於韩国首尔)。
联络方式:
[email protected]
6. 下载与开源
官方部落格目前未提供直接下载连结。
先前 Illustrious XL 系列多为开源或在 Hugging Face / Civitai 上释出,社群猜测
Illustrious Z 未来也可能开源,但尚未确认。
目前主要透过官方网站(illustrious-xl.ai)线上生成使用。
总结
Illustrious Z 是 Illustrious 系列的一次重要架构转型,从 SDXL 转向 DiT 类架构,主打场景理解与复
杂提示,适合需要丰富构图、多角色互动、精准文字或叙事性图像的创作者。
如果追求极致稳定与角色一致性,官方仍建议搭配 v3.6 使用;若想体验更强的「理解力
」,则推荐试用 Z。
--
Grok整理
继新出的Anima後旧的illu方面终於也有动作
理解复杂指令似乎是个不错的发展方向 人物重现度与构图的美观则看得出有待加强
只能说未来可期啦
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.36.243.215 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1776301765.A.4BC.html
1F:推 qiaffvvf: 哇喔 04/16 11:38
2F:推 rex7788: 等很久了 04/16 11:55
3F:推 rex7788: 很想试试看中日韩文 04/16 11:59
4F:推 v86861062: 可以色色ㄇ 04/16 12:36