谷歌表示正在开发一种可以自动将网页转换为短视频的AI系统URL2Video。该系统可以自动从HTML中提取诸如文本、图片以及字体、颜色和布局等设计模板,并将这些元素组成与原网页外观相似的视频。
该系统主要针对那些对自身产品和服务已经有详尽的网页介绍,但还未有视频介绍的公司。
谷歌表示,通过URL2Video处理网页信息,就可使产品和服务以视频形式触达更多的受众。而且相比起传统视频制作需要数天到数周的制作周期、880到1200美元的制作成本,URL2Video有着难以比拟的优势。
基于与专业剪辑师的讨论,URL2Video采用了一种启发式方法来确定视频编辑模版,包括内容层次、视频信息量及其每种元素的持续时间。URL2Video使用这种方式来解析网页、分析内容、挑选关键文本或图像、保留相似的设计风格,并根据用户的具体要进行修改。
如果我们看向这神奇功能背后的原理,就会发现视频转化技术离不开对网页元素的分类和排序。
URL2Video会在每个网页中提取文档对象模型信息和多媒体资料,将视觉上可区分的内容标记为视频中的可用元素,包括标题、产品图片、文字说明和外链等。
URL2Video提取的每个元素(即文本和多媒体文件)和网页相关信息(HTML标签、CSS样式等)都会根据其在原网页上的重要性进行排名和注释,以获得不同的优先级,例如在网页顶部占据较大区域的元素会得到更高的分数和优先级。
基于上述的元素排名方面以及启发式视频编辑模版,URL2Video可以得出视频中每个元素最佳的停留时间和位置分布。
网页转视频的最后一步就是格式调整,URL2Video会将图片的大小转换成适合视频画面的长宽比,根据风格和主题确定视频中采用的字体和配色,再转化为MPEG-4格式。
为了使视频简洁,URL2Video仅显示网页中的主要元素,如标题和主产品图,并会限制每个元素在视频中停留的时间。
谷歌表示在用户研究和测试中,URL2Video已经做到了从网页中高效地提取元素,并通过交互功能键来辅助用户剪辑。
谷歌科学家Peggy Chi和Irfan Essa在博客中写道:“尽管当前的研究重点是视觉展现,但我们正在研究视频编辑中的音轨和画外音等技术。总而言之,我们相信便捷的视频剪辑是大势所趋,而机器学习模型可以以交互的形式给剪辑师布局排版的建议,以快速创造多个高质量视频。”