中自网

热门搜索:电子  抽油机  PID  无线通讯  ABB  变频器  低压  电力电子 

当前位置:首页>>  方案与应用>>  方案锦集

搭配Intel® Media SDK的凌华科技aTCA-9300处理器刀片,大幅提升视频转码性能

放大字体  缩小字体 发布日期:2013-08-23   浏览次数:46784
近年来,随着市场和技术的发展,越来越多的集群网络架构开始转向基于模块化计算平台的架构,用以支持和提供多样化的网络单元和丰富的功能,如应用处理、控制处理、包处理、信号处理等。除了节约成本和缩短产品上市时间之外,在机架式系统和不同尺寸的网络设备上,此架构还可以提供模块化架构的灵活性以及随需而定的系统组件独立升级能力。



测试结果

在这个部分,我们使用了上述的测试方法来测试3个不同的转码任务,然后比较各自的转码性能。所使用的基准平台描述如下:
 

主板 凌华科技aTCA-9300处理器刀片
操作系统 Microsoft Windows 7 Professional 64-bit
CPU Intel®Xeon E3-1275V2
内存 Kingstone DDR3 1333MHz 8GB SDRAM
显示 Intel® HD Graphics G4000
Media SDK API Intel® Media SDK 系统分析器,支持的API 级别: HW 1.3, SW 1.4

测试1:1080P高清转码测试

首先,我们会评估一个高清的转码任务。源媒体是一个1080p MPEG-2格式的视频剪辑,播放时间为10秒,帧速率为30fps。目标媒体的格式是H.264,并且具有同样的分辨率。使用硬件方法的测试结果如附件表1所示,采用软件方法的测试结果如附件表2所示(以红色显示的结果表示转码时间超过了播放时间)。

通过对转码测试结果的比较,很明显,使用硬件的方法CPU的使用率非常低(约9%),而使用软件的方法则因为所有的转码都是由软件编码直接处理的,因此CPU使用率极高。

如果考虑实时转码的性能时,使用硬件的方法可以支持8个高清的转码流,而软件的方法只能支持1个高清转码流,并且当转码流的数量增至2个时,则需要长达23秒才能完成转码任务,这个处理时间远远大于被测视频剪辑播放持续的时间。

测试2: 1080p转480p分辨率下降转码测试

第二步测试我们来评估一下分辨率稍低些(1080p转480p)的转码任务。源视频和目标视频都采用H.264的格式,源视频为1080p视频剪辑,播放持续时间为10秒,帧率为30fps。目标视频的分辨率为480p。使用硬件方法的测试结果如附件表3所示,使用软件方法的测试结果如附件表4所示(红色部分表示转码所需时间超出播放时间)。

通过比较测试结果,很明显使用硬件的方法,CPU使用率远远再次低于使用软件的方法时CPU的使用率。

同样的,对于实时转码性能,硬件的方法可以同时支持16个转码流(H264.1080p 转 H264.480p),而软件的方法只能支持3个转码流。

测试 3:D1转CIF分辨率下降转码测试

最后,我们来测试一下低分辨率的转码任务。源视频格式采用D1(720x576)H.264视频剪辑,播放持续时间为97秒,帧率为25fps。目标视频为CIF(320x288) H.264格式,与源视频相同的帧率。使用硬件方法的测试结果如附件表5所示,附件表6为使用软件方法的测试结果(红色部分表示转码所需时间超出播放时间)。由于使用硬件的方法可以支持更多的转码流,因此我们在附件表5中只列举有几条有意义的参考数据。

与之前的测试一样,我们可以得出同样的结论:硬件方法的CPU使用率远远低于软件方法的CPU使用率。H264.D1转H264.CIF的实时转码性能方面,硬件的方法可以同时支持50个转码流,而软件的方法最多只能支持19个转码流。

分析

在本节中,我们对以上的测试结果做进一步的分析。图5列举了使用硬件和软件方法时最大实时转码流数量的比较。我们发现,当转码任务越困难时,硬件方法与软件方法的性能差距就越明显。比如1080p的转码任务,硬件方法的转码性能是软件方法的8倍,而D1转CIF,则只有3倍的差距。


图5:最大实时转码流数量比较

同样地,在比较实时转码任务中CPU的最大使用率时,使用硬件的方法也明显占优。因为使用硬件的方法调用GPU硬件来处理转码任务,所以维持了很低的CPU使用率。相比之下,软件的方法则完全使用CPU的性能来处理转码任务,因才所调用的CPU资源就相当的多。(请参看图6)


图6:实时转码时CPU的最大使用率

从性能比较的结果来看,很明显Intel® Media SDK能够有效利用GPU来分担CPU处理转码任务的负担,让转码速度变得更快,并且CPU资源的占用率更低。如果打算将控制平面和媒体处理整合到一个单一的平台上,这种优势便成为一个非常具有吸引力的选择。由于减少了CPU编解码的负担,可以让CPU集中更多的资源去处理常规的控制任务,并且让这些控制任务的处理变得更加快速和有效。

结论

本白皮书通过对比纯软件方法和基于GPU和Media SDK的硬件方法的转码,展示了凌华科技aTCA-9300所具有的精湛媒体处理性能。尤其对于高分比率的转码任务两种方式的转码对比愈加明显,如将1080p的mpeg2转码至h264, 由GPU和Media SDK所获得的性能提升是纯CPU转码时性能的8倍。 另一方面,aTCA-9300在进行硬件转码时还保持了较低的CPU利用率(< 10%). 节省下来的CPU能力可以用于处理其它应用任务。这使得凌华科技的 aTCA-9300成为客户寻求以较低成本获得更高吞吐量和性能时的理想平台。

最后,值得一提的是,所有的测试都是基于Microsoft Windows平台进行的,Intel®还没有发布Linux版本的Intel® Media SDK。一般来说,大多数媒体客户更喜欢Linux环境,所以我们认为Linux版本的Intel® Media SDK将更容易被一个更大的市场所接受。如果这个在不久的将来变成现实,我们将再来评估Intel® Media SDK Linux版本的性能以及其呈现的结果。

附录

在上面测试结果章节中描述的各种转码任务使用硬件的方法(HW)和软件的方法(SW)的测试结果。

注意:红色部分表示转码所需时间超出播放时间。


表 1: MPEG2.1080p 转 H264.1080p (使用硬件的方法)


表2:MPEG2.1080p 转H264.1080p (使用软件的方法)


表3:H264.1080p 转 H264.480p(使用硬件的方法)


表4:H264.1080p 转 H264.480p(使用软件的方法)


表5:H264.D1 转 H264.CIF(使用硬件的方法)


表6:H264.D1 转 H264.CIF(使用软件的方法)

 
 
[ 方案搜索 ]  [ ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]  [ 返回顶部 ]

0条 [查看全部]  网友评论