隔行扫描

时间:2023-11-01 21:17:10编辑:莆田seo君
说明原理

隔行扫描(Interlaced)是在显示设备表示运动图像的方法,每一帧被分割为奇偶两场图像交替显示,隔行扫描是一种减小数据量保证帧率的压缩方法。

隔行扫描

电视标准制订者考虑到交流电频率50或60Hz,所以确定了25或30fps的帧率(Frame rate),我国电视台标准为(PAL)制,指画面扫描50场每秒(每帧扫描2场画面,共25个奇场25个偶场)。两组25个字段一起工作,每1/25秒(或每秒25帧)创建一个完整的帧,两场图像构成一帧画面可以使带宽减小大约一半,但隔行扫描每1/50秒创建一个新的半帧(或每秒50个场 。另外隔行扫描信号中的伪像不能完全消除,导致帧之间会丢失一点信息。[1]编码方法

1、宏块自适应帧场(MBAFF)编码

mbaff编码

允许使用宏块对结构编码为帧的图像,可以将一个帧宏块划分为两个场宏块进行编码。

2、图像自适应帧场编码(PAFF或PicAFF)

允许自由选择的图像混合编码为完整帧,将两场合并为一帧进行编码,或者将两场分别编码。当图像同时存在运动区域和非运动区域时,由于PAFF自适应技术粒度太粗,无法实现满足更加精细的编码要求,于是在H.264(MPEG-4第10部分高级视频编码(MPEG-4 AVC))便引出了宏块自适应帧场(MBAFF)编码技术。

MBAFF对帧/场编码的选择是基于宏块的,其将两场合并为一帧进行编码,但将每一个帧宏块(16x16)划分为场宏块对(8*16),针对每一个帧宏块,编码器自动比较帧编码和场编码产生的码流大小,然后使用最节省码流的方式,并且可以避免产生伪像。

目的

如果模拟广播电视系统采用25或30帧逐行扫描扫描方式显示,当电子束从屏幕的上半部分移到下半部时,屏幕上半部分的亮度就有了可以观察到的衰减,于是画面下半部分显得更亮。这只是一个瞬间,事实上最亮的部分(当然就是电子束刚经过的区域)会不断移动,从而产生闪烁现象。为防止闪烁,最佳的办法是加倍刷新率,改成60p扫描,将每幅画面扫描2次,因为在60分之一秒内,人眼能感觉到的亮度衰减就很小了。可是这样做,单位时间内扫描的总行数会加倍,那么水平扫描的速度就要加快。如此一来技术要求就会过高,以当时的条件做不到。于是标准制订者想到了一个折衷的办法,先花60分之一秒扫描奇数行(上场),然后再用后60分之一秒扫描偶数行(下场),两者互补成完整的画面。虽然扫描下场时,上场的亮度衰减了,但是由于亮暗的部分交织在一起,反而不易察觉。?

隔行扫描

使用隔行扫描可以让每秒可以显示更多的帧,每帧显示更多图像,使带宽减少,隔行扫描提供完整的垂直细节,具有逐行扫描所需的相同带宽,但具有两倍的感知帧速率和刷新率。与非隔行扫描的镜头(帧速率等于场速率)相比,这有效地使时间分辨率(也称为时间分辨率)加倍。

无论是逐行扫描还是隔行扫描,都有视频文件、传输和显像三个概念,这三个概念相通但不相同。最早出现的是隔行扫描显像,同时就配套产生了隔行传输,而隔行扫视频文件是到数字视频时代才出现的,其目的是为了兼容原有的隔行扫描体系(隔行扫描就是还依然在广泛应用)。[2]

标识

格式标识符(如576i 50和720p 50)指定逐行扫描格式的帧速率,但对于隔行扫描格式,它们通常指定字段速率(帧速率的两倍)。这可能会导致混淆,因为行业标准的SMPTE时间码格式总是处理帧速率,而不是帧速率。为避免混淆,SMPTE和EBU总是使用帧速率来指定隔行格式,例如,480i 60是480i / 30,576i 50是576i / 25,1080i 50是1080i / 25。该惯例假设隔行扫描信号中的一个完整帧依次由两个场组成。

好处

屏幕截图(右侧)展示了去隔行扫描和隔行扫描图像之间的区别。

隔行扫描

模拟电视中最重要的因素之一是信号带宽,以兆赫为单位。带宽越大,整个制作和广播链就越昂贵和复杂。这包括相机、存储系统、广播系统和接收系统:地面、有线、卫星、互联网和终端用户显示器(电视和计算机显示器)。对于固定带宽,隔行扫描为给定的行数提供两倍显示刷新率的视频信号(与逐行扫描相比)帧速率相似的视频——例如 1080i 每秒 60 个半帧,而 1080p 每秒 30 个全帧)。较高的刷新率改善了运动物体的外观,因为它更频繁地更新其在显示器上的位置,当物体静止时,人类视觉会结合来自多个相似半帧的信息,以产生与所提供的感知分辨率相同的感知分辨率通过渐进式全帧。但是,如果源材料以更高的刷新率可用,则此技术才有用。影院电影通常以 24fps 录制,因此无法从隔行扫描中受益,隔行扫描是一种将最大视频带宽降低至 5MHz 的解决方案,而不会降低 60 Hz 的有效图像扫描速率。

在固定带宽和高刷新率的情况下,隔行视频还可以提供比逐行扫描更高的空间分辨率。例如,具有 60 Hz 场频(称为1080i60或 1080i/30)的1920×1080 像素分辨率隔行HDTV具有与具有 60 Hz 帧频(720p60 或 720p/60)的 1280×720 像素逐行扫描 HDTV 相似的带宽,但对于低运动场景,空间分辨率大约是其两倍。

但是,带宽优势仅适用于模拟或未压缩的数字视频信号。对于所有当前数字电视标准中使用的数字视频压缩,隔行扫描引入了额外的低效率。?EBU 进行的测试表明,即使帧速率是两倍,隔行视频相对于逐行视频节省的带宽也是最小的。即,1080p50 信号产生与 1080i50(又名 1080i/25)信号大致相同的比特率,和 1080p50 实际上需要更少的带宽,在编码“运动-类型”的场景。

在VHS,以及大多数其他使用转鼓在磁带上录制视频的模拟视频录制方法,都受益于隔行扫描。在 VHS 上,鼓每帧转一整圈,并带有两个图像磁头,每个图像磁头每转一圈扫过磁带表面一次。如果该设备用于记录逐行扫描视频,则磁头的切换将落在图像的中间并显示为水平带。隔行扫描允许在画面的顶部和底部进行切换,而这些区域在标准电视机中观众是看不到的。与每次扫描记录全帧相比,该设备还可以做得更紧凑,因为这需要双直径鼓以一半的角速度旋转,并在磁带上进行更长、更浅的扫描,以补偿每次扫描的双倍线数。然而,图像的相同区域,基本上将垂直分辨率减半,直到播放继续。另一种选择是在实际停止磁带之前按下暂停按钮来捕获完整的帧(两个场),然后从帧缓冲区中重复再现它。后一种方法可以产生更清晰的图像,但通常需要一定程度的去隔行才能获得显着的视觉效果。虽然前一种方法会在图像的顶部和底部产生水平伪影,因为磁头无法像在移动磁带上记录时那样沿着磁带表面完全相同的路径移动,但这种错位实际上在逐行记录时会更糟。

交错可以被利用来产生三维电视节目,特别是与CRT显示器和特别是对于彩色过滤眼镜通过发送键图像在交变场每只眼睛的颜色。这不需要对现有设备进行重大改动。快门眼镜也可以采用,显然需要实现同步。如果使用逐行扫描显示器来观看此类节目,则任何对图像进行去隔行扫描的尝试都会使效果无效。对于彩色滤光眼镜,图像必须被缓冲并显示为渐进式交替彩色键控线,或者每个场都必须对线加倍并显示为离散帧。后一种程序是在渐进式显示器上适合快门眼镜的唯一方法。

历史历程

当开发电影胶片时,必须以高速率照亮电影屏幕以防止可见的闪烁。所需的确切速率因亮度而异 - 在昏暗的房间内可接受40 Hz,而对于延伸到周边视觉的明亮显示器,可能需要高达80 Hz。胶片解决方案是使用三叶片快门将每帧胶片投影三次:以每秒16帧的速度拍摄的电影每秒照亮屏幕48次。之后,当声膜变得可用时,每秒24帧的更高投影速度使得双叶片快门能够产生每秒48次的照明 - 但仅限于投影仪无法以较低的速度投射。

此解决方案不能用于电视。要存储完整的视频帧并将其显示两次,需要帧缓冲器 -电子存储器(RAM) - 足以存储视频帧。直到20世纪80年代后期,这种方法才变得可行。此外,避免工作室照明引起的屏幕干扰模式和真空管技术的限制要求以交流线路频率扫描电视的CRT。(这在美国是60赫兹,50赫兹欧洲。)

在机械电视领域,LéonTheremin[4]展示了隔行扫描的概念。他一直在开发一种基于镜鼓的电视,从1925年的16行分辨率开始,然后是32行,最后在1926年使用隔行扫描64。作为他的论文的一部分,他在1926年5月7日电传输并投射近同步在五英尺见方的屏幕上移动图像。

1930年,德国Telefunken工程师FritzSchr?ter首先制定了将单个视频帧分解为隔行扫描线的概念并申请了专利。在美国,RCA工程师Randall C. Ballard在1932年获得了同样的想法。商业实施始于1934年,因为阴极射线管屏幕变得更亮,增加了由渐进(顺序)引起的闪烁水平扫描。[3]

1936年,当英国制定模拟标准时,CRT只能在1/50秒内扫描大约200行。使用交错,可以叠加一对202.5线场,以成为更清晰的405线框。垂直扫描频率保持50 Hz,但可见细节明显改善。结果,该系统取代了当时也使用的John Logie Baird的240线机械逐行扫描系统。

从20世纪40年代开始,技术的进步使得美国和欧洲其他国家采用逐渐增加带宽的系统来扫描更高的线数,并获得更好的图像。然而,隔行扫描的基本原理是所有这些系统的核心。美国采用称为NTSC的525线路系统,欧洲采用625线路系统,英国从405线路系统切换到625线路,以避免开发独特的彩色电视方法。法国从其独特的819系统切换到625的更欧洲标准。虽然术语PAL通常用于描述电视系统的线路和帧标准,这实际上是不正确的,并且仅指在标准625线路广播上叠加颜色信息的方法。法国采用了他们自己的SECAM系统,其他一些国家也采用了该系统,特别是俄罗斯及其卫星。PAL已被用于其他一些NTSC广播,特别是在巴西。

直到20世纪70年代,当计算机监视器的需求导致重新引入逐行扫描时,隔行扫描无处不在。Interlace仍然用于大多数标准清晰度电视和1080iHDTV广播标准,但不适用于LCD,微镜(DLP)或大多数等离子显示器;这些显示器不使用光栅扫描来创建图像,因此不能从隔行扫描中受益:实际上,它们必须用逐行扫描信号驱动。在去隔行从正常的隔行广播电视信号获得逐行扫描的电路可能增加使用这种显示器的电视机的成本。当前渐进式显示器在HDTV市场中占主导地位。

在20世纪70年代,计算机和家庭视频游戏系统开始使用电视机作为显示设备。此时,480线NTSC信号远远超出低成本计算机的图形处理能力,因此这些系统使用简化的视频信号,使每个视频场直接扫描在前一个视频上,而不是两条线之间的每条线。以前的字段。这标志着自20世纪20年代以来从未见过的逐步扫描的回归。由于每场成了自己的,现代术语一个完整的框架将调用此240P的NTSC套,以及288P的PAL。虽然允许消费者设备创建此类信号,但广播法规禁止电视台像这样传输视频。诸如CGA的计算机监视器标准进一步简化为NTSC,其通过省略颜色调制来改善图像质量,并允许计算机的图形系统和CRT之间的更直接连接。

到20世纪80年代中期,计算机已超出这些视频系统并需要更好的显示器。的苹果IIGS从使用旧的扫描方法的遭遇,具有最高的显示分辨率为640X200,产生严重失真的高窄像素形状,使得现实匀称图像的显示困难。各公司的解决方案差异很大。由于PC监视器信号不需要广播,因此它们消耗的带宽远远超过NTSC和PAL信号所限制的6,7和8MHz带宽。IBM的单色显示适配器和增强型图形适配器以及Hercules图形卡和原始Macintosh计算机生成的视频信号接近350p。所述准将Amiga的创建真正的隔行480i30 / 576i25RGB信号,适合于NTSC / PAL编码。这种能力导致Amiga在视频制作领域占主导地位直到20世纪90年代中期,但隔行扫描显示模式导致需要单像素细节的更传统PC应用的闪烁问题。1987年引入了VGA,很快就将PC标准化了,几年后苹果公司只推出了Mac标准,当VGA标准进行了改进,以匹配1987年推出的Apple专有的24位彩色视频标准。

在20世纪80年代末和90年代初期,显示器和显卡制造商推出了新的高分辨率标准,再次包括隔行扫描。这些监视器以非常高的刷新率运行,因为这将减轻闪烁问题。这种监视器非常不受欢迎。虽然起初闪烁并不明显,但眼睛疲劳和缺乏焦点仍然是一个严重的问题。该行业很快就放弃了这种做法,在过去十年的剩余时间里,所有监督者都保证他们所声明的决议是“非交错的”。这种经验就是为什么至二十一世纪PC行业仍然反对高清电视的交错,并游说720p标准。此外,业界正在游说超过720p,实际上是NTSC传统国家的1080 / 60p,以及PAL传统国家的1080 / 50p。

扫描区别

每一帧图像由电子束顺序地一行接着一行连续扫描而成,这种扫描方式称为逐行扫描。把每一帧图像通过两场扫描完成则是隔行扫描,两场扫描中,第一场(奇数场)只扫描奇数行,依次扫描1、3、5…行,而第二场(偶数场)只扫描偶数行,依次扫描2、4、6…行。

视频文件

摄像机的采像,从一开始其实不存在扫描,因为无论是胶片还是电子原件都是同时受光的。但是,要读取感光器上的信息(其核心任务将画面采样为YUV/RGB电信号),还是要靠扫描,于是读取每个像素的顺序就必须考虑。可以采取按顺序依次读取(逐行方式),也可以每行按顺序读取,但是先读完所有奇数行再读偶数行(隔行方式)。为了兼容电视机的隔行扫描体系,过带机(将胶片上的画面采样为YUV/RGB电信号并保存在磁带上的机器)和有些摄像机是隔行扫描制式的。当然也有逐行制式的产品。

当人们学会用电子原件感光和用数字化的计算机文件保存视频时,数字摄像机就实用化了。事实上用数字信息保存的依然是YUV/RGB电信号,只是变换了个介质,本质上没什么区别(这里指的是未压缩的视频,经过压缩后就大不一样了)。

但在计算机中,不管接到的是逐行还是隔行信号,都会按顺序逐一写入文件,不特别区分。如此一来,计算机上的视频,以逐行和隔行信号为讯源的文件肯定有区别,它们分别称为逐行扫描和隔行扫描视频。

交错视频

随着全球流行的广播电视的出现,制片人意识到他们需要的不仅仅是电视直播节目。便转向电影、电视剧、新闻、短视频等原创材料回放,然而低帧率视频文件对于高帧率回放设备之间的帧速率(刷新率)差异意味着简单地将电影播放到电视摄像机中会闪烁。因此需要进行一些插帧或帧复制(例如3:2下拉、2:2下拉等)让场同步(垂直同步),以调整电影和视频帧速率之间的速度差异。但是如果录制的视频文件帧率高于回放设备,只需要丢帧到广播电视标准即可。

反交错

有交错就有反交错。所有隔行扫描视频在计算机播放都进行反交错),只有那些自带反交错的电视才不需要这么做。

有几种去隔行扫描方法。

场扩展去隔行

这些方法取每一场(只有一半的行)并将其扩展到整个屏幕以制作一个框架。这可能会使图像的垂直分辨率减半,但旨在保持原始场速率(50i 或 60i 转换为 50p 或 60p)。

Half-sizing会单独显示每个隔行扫描场,从而使视频的垂直分辨率为原始未缩放的一半。虽然此方法保留了所有原始像素和所有时间分辨率,但可以理解的是,由于其错误的纵横比,不用于常规查看。然而,它可以成功地用于应用期望非隔行帧的视频过滤器,例如那些利用来自相邻像素的信息的过滤器(例如,锐化)。线加倍采用每个隔行扫描场的行(仅由偶数或奇数行组成)并将它们加倍,填充整个帧。这导致视频具有与场速率相同的帧速率,但是每个帧具有垂直分辨率的一半,或者分辨率等于构成帧的每个场的分辨率。线倍增可防止梳状伪影,但会导致图像质量明显降低,因为显示的每帧都加倍,实际上仅在原始半场分辨率下。这在静止物体上很明显,因为它们看起来像是上下摆动。这些技术也称为bob去隔行和线性去隔行出于这样的原因。线倍增保留了水平和时间分辨率,但牺牲了垂直分辨率和静止和较慢移动物体上的浮雕伪影。该方法的变体丢弃每帧中的一个场,使时间分辨率减半。

线加倍有时与一般的去隔行或插值(图像缩放)相混淆,插值使用空间滤波来产生额外的线,从而降低像素化在任何类型的显示器上的可见性。术语“line doubler”在高端消费电子产品中使用得更频繁,而“去隔行”则更频繁地用于计算机和数字视频领域。

场组合去隔行

将偶数场和奇数场组合成一帧。这将感知的帧速率(时间分辨率)减半,从而将 50i 或 60i 转换为 25p 或 30p。

编织(Weave)通过将连续的字段添加在一起来完成编织。当图像在字段之间没有改变时,这很好,但是当一帧中的像素与另一帧中的像素不对齐,形成锯齿状边缘时,任何改变都将导致称为“梳理”的伪像。该技术以时间分辨率(运动)的一半为代价保留了完整的垂直分辨率。混合(Blending)是通过完成共混,或平均连续的场被显示为一帧。避免梳理,因为图像在彼此之上。这样就会留下一种称为鬼影的伪像。图像失去垂直分辨率和时间分辨率。这通常与垂直调整大小相结合,因此输出在垂直分辨率上没有数值损失。这样做的问题在于存在质量损失,因为图像已经缩小然后增大。这种细节损失使图像看起来更柔和。由于两个运动场组合成一个帧,因此混合也会丢失一半的时间分辨率。选择性混合(Selective blending),或智能混合或运动自适应混合,是编织和混合的组合。由于帧之间没有变化的区域不需要任何处理,所以框架是编织的,只有需要它的区域被混合。这保留了完整的垂直分辨率和一半的时间分辨率,并且由于两种技术的选择性组合,它具有比编织或混合更少的伪像。反向电视电影(IVTC、Inverse Telecine):电视电影用于将运动图像源以每秒24帧的速度转换为使用NTSC视频系统,每秒30帧的隔行扫描电视视频。以每秒25帧的速度使用PAL的国家不使用电视电影,因为运动图像源加速4%以达到每秒所需的25帧。如果使用Telecine,则可以反转算法以获得具有较慢帧速率的原始非隔行扫描素材。为了使其工作,必须知道或猜测确切的电视电影模式。与大多数其他去隔行方法不同,当它工作时,反转电视电影可以恢复原始的逐行扫描视频流。Telecide风格的算法:如果隔行扫描的镜头是以较慢的帧速率(例如“卡通下拉”)从渐进帧生成的,则可以通过从匹配的上一帧/下一帧复制丢失的场来恢复精确的原始帧。在没有匹配的情况下(例如,具有提升的帧速率的简短卡通序列),则滤波器回退到另一种去隔行方法,例如混合或行加倍。这意味着Telecide的最坏情况是偶尔出现重影或降低分辨率的帧。相比之下,当更复杂的运动检测算法失败时,它们可能会引入对原始材料不忠的像素伪像。对于电视电影视频,抽取可以作为后处理应用以降低帧速率,并且这种组合通常比简单地反转电视电影更稳健,当不同的隔行扫描的素材被拼接在一起时,它会失败。[3] 运动补偿去隔行

更高级的去隔行算法结合了传统的场组合方法(编织和混合)和帧扩展方法(bob 或 line double)来创建高质量的逐行视频序列。运动方向和运动量的基本提示之一是隔行信号中组合伪影的方向和长度。

最好的算法还尝试预测后续场之间的图像运动的方向和数量,以便更好地将两个场融合在一起。他们可能采用类似于块运动补偿的算法用于视频压缩。例如,如果两个字段的人脸向左移动,则编织会产生梳理,而混合会产生重影。高级运动补偿(理想情况下)会看到多个场中的人脸是同一幅图像,只是移动到不同的位置,并会尝试检测此类运动的方向和数量。然后,该算法将尝试通过将图像组合在一起,通过检测到的运动量沿着检测到的方向移动每个场的部分来重建两个输出帧中面部的全部细节。使用这种技术的去隔行器通常更胜一筹,因为它们可以使用来自多个领域的信息,而不是只使用一两个领域,但是它们需要强大的硬件来实时实现这一点。

运动补偿需要结合场景变化检测(这有其自身的挑战),否则它会试图在两个完全不同的场景之间找到运动。执行不佳的运动补偿算法会干扰自然运动,并可能导致视觉伪影,这些伪影在应该是静止或平滑移动的图像中表现为“跳跃”部分。例如,如果两个字段的人脸朝左移动,则编织将创建梳理,并且混合会产生重影。高级运动补偿(理想情况下)会看到几个场中的脸部是相同的图像,只是移动到不同的位置,并试图检测这种运动的方向和数量。然后,算法将尝试通过将图像组合在一起来重建两个输出帧中的面部的全部细节,沿着检测到的方向移动每个子场的部分移动检测到的移动量。运动补偿需要与场景变化检测相结合,否则它将尝试在两个完全不同的场景之间找到运动。实现不良的运动补偿算法会干扰自然运动并且可能导致视觉伪像,其表现为应该是静止或平滑运动图像的“跳跃”部分。[2]

上一篇:全球币

下一篇:转运珠手链几颗好