HRM:控制 IMSC 文档的复杂性

作者及发布日期

由:
发布:

注:下文译自 W3C 时序文本标准工作组主席 Nigel Megitt 发布在 W3C 全球官网的博客文章(见英文原文)。

IMSC 标准包含一个假设渲染模型(Hypothetical Render Model,简称 HRM)来限制文档的复杂性,让字幕开发者知道他们不会生成使播放器超载的字幕。围绕 HRM 的开源实现在这里

欢迎 IMSC 用户和标准实现者对照该实现(或其他实现)进行文档测试,并进一步反馈与 HRM 相关的问题。

HRM 是什么?

正确呈现视频媒体的字幕是复杂的。很多人首先想到的是视觉外观:它是否支持所需的全部脚本和布局功能、颜色、位置、字体等等?实现所有这些都需要高度的复杂性,这可能意味着呈现字幕的处理时间变得十分重要,尤其是在实时播放视频的情况下 — 在你要求渲染文本或图片之前,你的 Web 播放器已经在播放视频和音频方面做了大量工作,并具有帧精确同步。

时间也是正确呈现字幕的关键因素:延迟、显示时长不够抑或根本没出现的字幕,都是真正影响观众体验的问题。

视频播放器的实现者需要代码具备足够的性能来显示字幕,为此,他们要知道必须处理的最糟糕的复杂性是怎样的。

字幕开发者需要知道他们不会生成使播放器超载的字幕。

IMSC 标准对此的解决方案是一种可以在文档上静态运行的算法,例如无需执行完整渲染,以确定文档的复杂性是正常或太大。这种机制被称为假设渲染模型 (HRM)。它使用双缓冲模型,要求每次显示更改之后有足够的时间,来渲染将在下一次更改时显示的内容,通过渲染模型和一些预定义的值来实现预期的渲染性能。

IMSC 标准(全称 TTML Profiles for Internet Media Subtitles and Captions)定义了 TTML 的两个配置文件:一个是纯文本文件,另一个是纯图片文件。这些文件旨在广泛用于全球的字幕交付应用程序,从而简化互操作性,并保持与其他字幕文件格式的一致性和兼容性。

IMSC 1.2 是 IMSC 标准的最新版本,已用于 CMAF、DASH、IMF、ATSC、DVB 等应用程序,支持 SMPTE-TT、EBU-TT-D 以及其他区域性实践。 IMSC 1.2 还支持可下载字体资源,该特性通过为客户端提供制作期间使用的准确字体来提高保真度,并允许将图片添加到内联文本内容中。 

相关的 RSS

(0)条评论

该贴的评论区已关闭。