IP流播出多语言、多字幕实现方法探讨

2014-08-27 08:15:23
摘要

在传统DVB播出系统中,字幕信息都是通过台标字幕机叠加到视频画面中,然后通过编码打包方式,将IP流推送到传输环节进行播出。多语言、多 字幕方式的DVB播出,改变了传统DVB播出的字幕直接叠加方式,将多音频和多字幕同时推送到用户接收端,用户根据自己不同的需要可以选择不同的 音频和字幕进行观看。这种实现方式在多民族、多语言地区,能够更好的满足当地不同用户的不同观赏需要,确保节目语言的按需提供。要实现多语言、 多字幕的DVB播出系统,需要制作、播出、字幕、传输、接收端等多个环节都按照DVB多字幕的标准进行制作和播出。本文将主要针对多语言的系统架 构和关键技术进行相关分析和探讨。

关键词:DVB(Digital Video Broadcasting),字幕流,字幕服务,TS流

背景

为发展先进文化满足人民群众精神文化需求,促进民族电子工业发展和“保增长、保民生、保稳定”的客观需求。在多民族、多语言地区播出时, 需要能够在一套节目中可以包含多种语言字幕,使当地居民可以按需选择字幕。例如在国内的西藏、新疆;国外,如非洲地区,同时存在英语、法语、 葡萄牙语等语言。如果只是针对某一个民族语言进行播出,并不能达到节目全部覆盖区域的目的,但如果同一节目制作不同的版本,则会大大提高制作 及播出成本。DVB多语言、多字幕播出技术,很好的弥补了这方面的不足。

字幕有两种形式,开放型字幕(Open Caption)和关闭型字幕(Closed Caption)。开放型字幕是合成在视频画面中,用户无法进行关闭,好处是接 收设备简单,不需要单独处理字幕。另外一种是关闭型字幕,字幕信息独立于视频画面,在接收端完成字幕叠加到视频画面,用户在终端可以通过遥控 器选择或者关闭。

多语言多字幕系统的实现主要是采用关闭型字幕,遵循DVB播出标准中的ETSI EN 300 743标准,在节目的制作环节,就要把字幕信息文件和视音 频文件一起发送给播出系统,由播出系统将视音频文件和字幕文件通过转码方式合并为到同一播出格式文件中,然后通过IP流播出服务器,将带有多语 言多字幕的IP流推送到字幕系统及后端的传输系统,最后通过卫星或有线网络进行播出。

系统架构

在多语言多字幕的DVB播出系统中,节目主要经过了转码系统,流播出系统,字幕系统以及流监看系统(如图1)。其中应用了多语言多字幕技术 的模块主要是转码系统、流播出系统

播出整备模块需要将从制作系统传过来的视音频文件和多个字幕文件(SRT)转码合成符合播出标准的包含多语言多字幕的播出格式文件,然后根 据节目单策略自动迁移到主备IP流播出服务器上,IP流播出服务器加载播出格式文件后,将视频流、音频流以及字幕流进行分离,根据TR290标准,重 新打包推送TS流到字幕系统,字幕系统根据字幕单,叠加开放型字幕到视频中,对关闭型字幕进行相应的透传,最后由传输设备传输到接收终端(机顶 盒)。

关键技术

DVB字幕系统协议提供了用于字幕流解码的语法。一个字幕流可以包含一种或多种语言字幕,还可以支持文本或图形的字幕显示,以便对于特定字 符的显示和表达。

每种语言称为一个字幕服务,每个字幕服务中的页面信息都包含了字幕以何种顺序叠加到视频中。一个字幕页中包含一个或多个区域,每个区域都 是有一个特殊属性的矩形区域。这些属性包括显示区域定义,字体的宽度和高度,像素亮度及背景颜色。图像中出现字幕的地方原始背景区域将被字幕 对象替代。这个对象可能是一个字符,一个字,一个字,一行文字或整个句子;它可能还定义了一个标志或图标。在一个区域内可以定义多个字幕显示内 容及显示顺序。在一幅图像中也可以定义多个区域,每个区域显示不同的内容,如图所示

图主要表达的意思是,在两幅图中,区域1显示的是台标,区域2中显示的是字幕。而在同一个区域,时间不同,显示的内容也可以不同,如在图 像1中显示的是“Shall we?”,在图像2中显示的是“Said the fly on the mirror”

如何将这些字符信息加入到TS流中呢?一个DVB字幕流信息是加载PES包中的,PES偷信息中的PTS定义了字幕的显示时间。接收的字幕数据显示 的时间都是通过PTS来指定的。当接收机接收到新的字幕对象时,解码器会根据PTS信息自动更新当前图像显示的字幕信息。当然,如果本身视频图像不 变,则只需要提供字幕流信息,就可以更新字幕属性(如显示内容和显示时间)。当然,为了解决接收端可能随机开始接收数据,字幕的自动刷新也是 非常有必要的。因此,每条字幕都有其超时属性设置,如果超过此时间,会自动刷新字幕。

一个字幕流中可以包含多个字幕服务,也就是多种语言的字幕。目前由两种方式对不同语言的字幕进行标识和显示,一种是将所有语言字幕都使用 同一PID标识,不同的语言使用不同的page-id来区别。如下图所示

另外一种是在PMT表中使用不同的PID标识不同的字幕,然后再PES包中再做具体描述,如下图所示

通过以上方法,就可以将多个字幕文件组合在一个TS流中进行播出。

常见问题及解决方案

以上从简单的几个方面介绍了对播出系统进行运行维护的指导思想和方法,从实际出发进行科学化、规范化、流程化的管理,在实践中经受了检验。 欢迎各位同行和我们继续交流,帮助我们进一步提高,更好地为用户提供高品质的服务!

1. 字幕显示不正确

有些语言字幕在显示时,出现显示不正确或乱码的情况。这个通常是由于是通过字符集方式进行的字幕叠加。第三部分介绍到,字幕可以通过文本 方式或图像方式进行显示。如果采用文本方式,就需要接收端(如机顶盒),支持文本字符集,如果接收端没有相应的字符集库,则无法正确显示文本 信息。而这种情况,采用图片显示就不存在问题,因为图片方式是将字幕在传输前变为图片,然后压缩到字幕流中,因此这种方式是不依赖于接收端的,在任何接收端都可以正常显示。

2. 字幕显示后无法自动消失

目前控制字幕显示时间长短有两种方式:刷屏模式和TIMEOUT模式。刷屏模式是指在字幕上和下的时候,发送两条指令来控制字幕的出现和消失, 这种方式可以精确到帧。另外一种模式为TIMEOUT模式,也就是在字幕上的时候,就包含了字幕显示多长时间的信息,由接收端自动控制字幕的消失, 这种方式的精确度只能到秒级。无论是那种方式,都需要接收端相应支持。因此有可能在实际系统中,需要根据接收端不同的情况,改变不同的字幕上下属性,来保证字幕的正常显示和消失。

案例分析

四达时代IP流播出系统主要针对非洲用户,提供30个频道的标清播出以及未来扩展10个高清频道播出的任务。其中有3-5个频道为了适应非洲当地 需要,要求建设为多语言、多字幕播出频道。下图为四达时代的系统结构图

整个系统主要分为前端信源编码、内容整备平台、流播出控制系统以及流监看系统。制作系统在将多语言多字幕文件做好后,发送到播出系统,由 播出整备系统将字幕信息加入到视音频文件中,然后通过IP流视频服务器进行TS流的播出。

系统架构设计继承和发扬了正奇联讯在多家主流电视台硬盘播出系统建设的架构和设计思路,系统内的所有关键设备全部采取主备冗余配置。系统 设计规模初步按照可以满足30个频道7*24小时安全播出的规模,并且具有一定的扩展空间,可以提供方便的系统规模扩展方案,架构设计支持未来可扩 展为高清播出的需求,不用对本次投入的播出服务器硬件设备进行调整。

在网络结构上时,整体按照核心交换机和接入交换机的二层模式,并建立了双网架构,在设计与外界系统交互的安全时配置了防毒墙与防火墙,而 在设计内部子系统的功能划分时又按照不同的业务运用进行了交换机的分类:流监看管理交换机、监控管理交换机和数据交换交换机。

未来发展

由于目前多语言多字幕方式,在国内还没有很广泛的开展,主要是由于字幕信息是隐藏部分,对于广电总局的监管,存在一定安全隐患。因此,未 来的多语言多字幕,需要针对字幕的内容,能够提供自动分析及关键字提取功能,这样才能更好的应用于国内DVB安全播出领域中。

  • 北京正奇联讯科技有限公司   © 2022 www.zqvideo.com 版权所有  京公网安备11010802014739号   ICP证:京ICP备14009498号-1
  • 地址:北京市海淀区西四环北路131号院1号楼3层336号    电话:010-62986676