作者EijiHoba (我要好工作)
看板AI_Art
标题[情报] OpenAI图片生成AI新方法sCM,速度是传统扩散模型的50倍
时间Sat Oct 26 18:29:42 2024
OpenAI图片生成AI新方法sCM,速度是传统扩散模型的50倍
OpenAI新开发的sCM方法明显加速取样过程,只需要两步骤即可生成高品质样本,效率约是传统扩散模型的50倍,适合即时生成应用
文/李建兴 | 2024-10-25发表
OpenAI研发了一种称为sCM(Continuous-Time Consistency Model)的生成方法,能够大幅提升取样速度,相比传统的扩散模型,sCM只需要两步骤取样即可生成高品质样本。研究显示,sCM在生成效率提升约50倍,且样本品质与最佳扩散模型相当,适合用於即时生成应用。
扩散模型已广泛用於生成图片、3D模型、音讯和影片,但是传统扩散模型取样过程缓慢,通常需要数十到数百个逐步降噪的过程,才能生成一个高品质样本,因此,这类模型在即时应用和大规模资料生成方面效率很低且难以扩展,虽然现在已经有一些技术能够加快扩散模型的速度,但是通常伴随复杂训练过程,甚至是样本品质下降的副作用。
为了解决扩散模型的既有问题,OpenAI研究团队开发了sCM。sCM这种经过改良的生成模型方法,只需要两个取样步骤即可生成与扩散模型品质相当的高解析度样本,大幅缩短生成样本的时间。由於sCM可实现约50倍的速度提升,因此特别适合用於即时应用,像是图片、音讯和影片生成。
sCM也具有高可扩展性和稳定性,该模型可以处理大规模资料集,并能扩展至拥有15亿参数的模型,而且在该规模下,sCM仍可保持高品质生成效果。sCM训练过程利用预训练扩散模型蒸馏出来的知识,在缩短了取样时间的同时,保持高品质样本生成。
研究人员使用ImageNet 512x512资料集训练的sCM,能够生成细节丰富且高品质的图像,展现其在高解析度生成方面的能力。虽然sCM只有两个取样步骤,但是生成的样本品质依然可接近最佳扩散模型,研究人员使用FID(Fréchet Inception Distance)分数进行评估,sCM样本品质与需要数百步骤取样的扩散模型相比,差异不到10%。
https://ithome.com.tw/news/165684
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.248.38.232 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1729938587.A.32B.html