作者eateat (吃吃队队长)
站内AVEncode
标题[情报] XviD的历史与特点
时间Fri Aug 20 10:58:11 2004
http://easylearn.bhes.tpc.edu.tw/high/xvid_history.htm
『 XviD的历史与特点 』
作者:沈晟 中文化 by Denise
2002 年, TDX 2002 的规则中, 除了允许使用旧有的 DivX 3.11 编码之外, 新加入了第
二种核准使用的编码--也就是本文标题中的 XivD 编码。作为每年在网上放出数千部最新影
片的网上高品质影音组织, 他们所遵循的规则对於整个 MPEG-4 编码的应用市场来说, 都有
决定性的重要意义。XviD 在 TDX 2002 中, 以 DivX3.11 的替代者的姿态出现, 还有人戏
称 : XviD 是继承 DivX3.11 的非商业个人版。那麽 XviD 到底是什麽? 它又有些什麽通天
本领的视频压缩本领? 或许您并不知道的是 : XviD 是个本来不会出现的东西……
几经波折的诞生记
4 年以前, 在 PC 上能用的唯一 MPEG-4 编码器就是由微软所开发的, 包括 MS MPEG4 V1
、MS MPEG4 V2、MS MPEG4 V3 的系列编码核心。其中前面两种都可以用来制作 AVI 档案,
至今都作为 Windows 的默认组件。不过 V1 和 V2 的编码质量都还不太好, 直到 MS MPEG4
V3 开始, 画面质量有了显着的进步。不过微软却决定仅将这个 MS MPEG4 V3 的视频编码
核心封闭在 Windows Media 流媒体技术, 也就是我们熟知的 ASF 档案之中, 不再能用於 A
VI 档案。ASF 档案当然有一些好处, 但是过於封闭甚至不能被编辑, 惹恼了天不怕地不怕
的电影骇客。很快便有小组修改了微软的 MS MPEG4 V3, 解除了不能用於 AVI 档案的限制,
并开放了其中一些压缩参数, 由此, 也就诞生了我们今天所熟悉的 MPEG4 编码器 DivX 3.
11。
DivX广泛流行, 成为 DVDRip 的标准, 问题是, 它的基础技术是非法盗用微软的, 只能在
地下里流传却上不了台面, 无法进行更广泛的产品化, 更无法生产硬体播放机。在这种情况
下, 一些精通视频编码的工程师 (包括原 DivX 3.11 的开发者) 成立了一家名为 DivX Net
works Inc. 的公司, 简称 DXN。DXN 发起一个开放原始码专案 Project Mayo, 目标是开发
一套全新的、开放原始码的 MPEG4 编码软体。特别是完全符合 ISO MPEG4 标准的 Open Di
vX CODEC 吸引了许多软体高手参与, 并很快开发出Open DivX 编码器和解码器原型, 之後
又开发出更高性能的编码器 Encore 2 等等。这一时期, 主要编码工作是 DXN 的人在做,
而许多技术难关的解决得力於来自开放原始码社会的帮助。
就在一切都看起来进展顺利的时候, 好戏上演了。Project Mayo 当然是开放原始码, 但
不是依据 GPL (通用公共许可证, 一种开放原始码项目中常用的保障自由使用和修改的软件
或原始码的协议) 。DXN 在设计授权协议时留了一手, 2001 年 7 月, 就在 Encore 2 基本
成型, 差不多可以产品化的时候, DXN 另搞了一个 DIVX.COM 网站, 封闭了原始码, 发布了
他们自己的 DivX 4。DivX 4 的基础就是 Open DivX中 的 Encore 2, 但利用了 DivX 的牌
号, 可以说出乎意料的摆了所有人一道。由於 DXN 不再参与, Project Mayo 陷於停顿, En
core 2 的原始码也被 DXN 从伺服器上撤下。经过激烈的争论, DXN 当然承认 Encore 2 在
法律上是开放的, 但仍然拒绝把它放回伺服器。开放原始码社会就这样被狠狠地涮了一回。
Open DivX 尚不能实际使用, 而 DivX 4 (以及後续的收费版本 - DivX 5) 等等都成了私
有财产, 许多人为打破微软垄断而无偿付出的智慧和劳动仅仅是帮助了 DXN 发财, 这种结
果当然是不能被接受的。为此, 整个 0dayz 组织永远的拒绝了 DXN 公司的 DivX4\5, 而原
Open DivX 开发组中的幸存者, 逐渐重新聚拢开发力量, 在最後一个 Open DivX 版本的基
础上, 发展出了 XviD。
劫後余生的 XviD 到线在又度过了近 1 年时间, 它继承并发展了 Open DivX Encore 2,
性能得到极大提高, 被认为目前世界上速度最快的 MPEG4 CODEC。XviD 重写了所有代码,
并吸取前车之鉴依照 GPL 发布 (注意不再是 LGPL, 所以谁要是想用它做成产品而不开放原
始码是非法的) 。不过, 因为 MPEG4 还存在专利权的问题, 所以 XviD 只能仿照 LAME 的
做法, 仅仅作为对如何实现 ISO MPEG-4 标准的一种研究交流, 网站上只提供原始码, 如果
要使用就要自己编译原始码或者到第三方网站下载编译好的可运行版本。
想当初 Gaj 之流的几个家伙搞 Open DivX 的时候, 一开始是很像一个像模像样的开放原
始码项目, 很多人都被吸引过去一起开发, 测试。直到後来, 那几个家伙一夜之间露出骗子
的本来面目了, 把 Open DivX 的成果一股脑带走, 变成了封闭原始码的 DivX4, 而後进一
步变成现在的收费的 DivX 5 了。本来很好的 Open DivX 被逼流产, 不过也就促成了今天
XviD 的诞生、发展和壮大。现在的 XviD 更可以说超越了 DivX 5, 以更好的质量, 更强的
功能挑战着新一代的 MPEG4 应用战场。
丰富多彩的技术特性
不仅 XviD 的出线本身就是开放原始码社会中典型的一部教科书, 它在技术上的各种新特
性也都是货真价实、童叟无欺的。对於一个第二代的 MPEG4 视频编码核心来说, XviD 的各
种演算法设计都有代表性的先进意义。
多种编码模式:
除了最原始单重估定码流压缩 (1-pass CBR) 之外, XviD 提供了包括 : 单重质量模式
动态码流压缩、单重量化 (Quantization) 模式动态码流压缩、和包括外部控制和内部控制
的两种双重 (2-pass) 动态码流压缩模式。XviD 显然是目前 PC 上的 MPEG4 编码核心中,
可选模式最多的视频编码。
其中特别是双重 (2-pass) 动态码流压缩模式, 通过检测画面运动幅度以最优化的方式曲
线分配画面量化幅度, 使充满活性元素的视频影片可以在占用空间和画面质量之间获得最佳
的平衡。而单重量化 (Quantization) 模式动态码流压缩, 可以高速地一次性生成可控画面
细节的动态码流视频档案, 在较少的压缩时间代价之下, 可以获得较稳定的画面细节质量,
这都是单纯的 DivX 3.11 所不具有的优秀功能。
量化 (Quantization) 方式和范围控制
量化 (Quantization) , 简单的说就是在编码时通过对时间或空间上相邻的画面单元进行
同化、模糊细节的程度, 是对画面质量最基本的控制因素。XviD 不仅提供了标准的 MPEG
量化方式, 还特地提供了更适合低码流压缩的 .h263 量化方式。并且 XviD 还可以在双重
(2-pass) 运算时, 根据对画面资讯的综合分析, 动态的决定某段场景的画面量化方式, 真
可以说是为网络媒体档案传播中, 空间与画质的平衡而考虑, 设计贴心得到家了。
除了量化方式选择, XviD 还提供了强大的对压缩过程中的量化幅度的范围控制。用户可
以选定压缩时允许使用的量化幅度范围。例如设定一个量化的上限, 就可以避免可能出线的
画质大幅下降的情况。
运动侦测 (Motion Search) 和曲线平衡分配 (Curve)
对画面逐帧进行运动侦测, 以及对全片段的运动侦测结果进行分析後, 重新以曲线平衡分
配每一帧的量化幅度, 以做到 : 需要高码流的运动画面可以分配更多空间、更高的码流、
更低的量化幅度来保持画面的细节; 而对於不包含太多运动资讯的静态画面, 则消减分配预
算。这种把好钢用在刀刃上的做法, 是 XviD 做为第二代 MPEG4 编码的核心内容。
XviD提供了多极运动侦测精度, 包括半图元插值 (half pixel interpolation) 的技术以
16x16 图元的微区块为单元标示上运动向量; 以及 4 分运动向量 (inter4v motion vecto
rs) 的方式, 以 8x8 的图元区块为单元更细致的纪录运动向量以供二重分析。
动态关键帧距 (I-frame interval)
动态关键帧距是另一个 XviD 所具有的, 在空间和画面之间获得最大平衡的技术。我们知
道在视频压缩中不是每一帧都记录着全部的画面资讯, 事实上只有关键帧记录着完整的画面
资讯, 而後续的 P 帧 (P-Frame) 仅仅是纪录下与之前一帧的差值。如果关键帧之间的画面
变化很大, 则会浪费宝贵的空间在 P-Frame 上; 而加入把变化很大的那一帧记录在关键帧
里, 那麽由於後续的帧不再有更大的变化, 就可以节省 P 帧所需的空间。因此, 根据画面
镜头切换和运动幅度来变换关键帧的位置, 对於视频压缩下的画面质量提高, 就有着事半功
倍的效果。
心理视觉亮度修正
除了基本的 MPEG4 编码外, XviD 还提供了不少附加功能。其中典型的就是心理视觉亮度
修正。这个功能可能通过去除肉眼不能分辨的亮度信号和亮度差异, 来提高压缩效率。遗憾
的尽管这个设计非常的有创意, 但是目前的实际应用中却会导致肉眼可见的画面质量下降,
还期待在日後的版本中可以有所改进。
另外一个贴心的设计是电影专用的"演职员表选项"。这个功能可以在用户指定的某些不必
要保留细节的段落处 (例如电影的演职员表) , 设定下极低的码流。甚至压缩到正片码流的
10%以下, 可以节省不少空间, 设计的也非常的贴心。
外部自定义控制
除了 XivD 自己的内部曲线分配控制方式外, XviD 也提供了外部的开放介面。允许使用
者略过 XviD 本身的编码分析核心, 利用第三方提供的外部分析工具, 例如 Gordian Knot,
生成的分配好的控制档案, 再交还 XviD 做最终的二重运算压缩。这种方式扩展了 XviD
的可用性和用户控制程度, 因为像 Gordian Knot 这种软件甚至可以做到由用户控制每一帧
的量化幅度和码流分配额度, 可以为高级应用提供更多的可能性。
运动向量加速 (Hinted Me) 编码
XviD 还有专为提高编码效率而开发的设计, 就是纪录下画面的运动向量资讯至一个 Log
档案中。再在二重运算压缩时通过直接读取该档案中的资讯, 节省下对运动向量资讯的重复
运算, 大幅提高编码速度。
画面优化解码
不仅在编码上 XivD 拥有强大的功能, 在解码时的画面优化方面, XviD 也有很多新的建
树。例如 "Horizontal deblock (Y)" 可以柔化水平方向的亮度马赛克; "Horizontal debl
ock (C)" 可以柔化水平相的色度马赛克; "Deringing(Y)" 可以柔化环状亮度色斑; "Deing
ing (C)" 可以柔化环状色度色斑; "mosquito" 可以减少画面中的蚊状噪斑。并且, 这些 X
viD 的画面优化手段都是可选的, 因此只要关闭几个不是那麽必要的选项, 就可以在低配置
的PC机上播放。
正在开发的 B 影格
另一个 XviD 中引人注目的技术发展, 就是 B 影格。我们知道 I 影格就是关键影格, P
影格在关键影格之间, 只储存与之前一幅已解压画面的差值。B 影格与 P 影格的原理一样,
但除了三者之前解压了的画面外, 亦会参考後面一影格中的画面资讯。因此 B 影格解压出
来的画面比P影格就要来的好。
之前的 MPEG4 编码核心都仅仅使用了 I 影格和 P 影格存储画面。如果能在此基础上使
用 B 影格技术, 自然可以在画质和压缩比上更上一层楼。目前 XviD 已经为开发人员提供
了测试性质 B 影格体验版的 XviD 编码核心, 相信不久的将来, XviD 就可以把 MPEG4 编
码的优势发挥到极致, 成为网上视频记录格式的盟主。
http://easylearn.bhes.tpc.edu.tw/high/xvid_history.htm
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 220.134.135.59
1F:推 NelsonT:好文 140.113.89.77 08/20