Dec 9, 2020 | 技术流
视频字幕制作分享
众所周知,字幕是机器算法理解视频内容的重要方式。
1⃣️ 算法理解了视频的内容,才能更好地进行搜索和推广;有字幕的视频,Google 搜索时甚至能定位到视频中某一位置的内容
2⃣️ 上传字幕的视频,通过 YouTube 自动翻译功能让其他语言的小伙伴也能看懂视频,从而把内容分享给国际友人。
以上所指的字幕,还不是嵌在视频里的文字,而是通过【字幕】功能上传的 srt、irc、sub 等带时间轴+文字内容的格式的字幕文件。而且字幕文件独立于视频,随时可以修改文字内容。
而压嵌在视频里的字幕是达不到以上效果的,既不能随时修改也不能供给算法分析,唯一的(我理解)好处是通过视频软件自定义更美观的样式,给观众更好的观看体验。
在做视频这段过程,我也为字幕挠破头皮,到现在还没有完美的字幕流程解决方案。但可以跟大家分享我使用过的一些字幕制作的方式、优缺点、适用场景、价格,抛砖引玉,希望从评论中获得更多字幕制作技巧。
ArcTime
💰 免费
💻 官网:https://arctime.org/
想要长期、免费、熟练掌握的一款字幕软件我会推荐 ArcTime,前提是已经拥有视频文字稿。并且 ArcTime 支持中英双语制作,同时既可以修改样式内嵌在视频中,也可以导出成字幕文件上传到 YouTube、B站等平台。
我的知识分享类视频都有完整的视频文字稿,用 word 或者 VSCode 的替换功能把逗号、句号替换成折行(左边),就能生成一行一句的文字内容(右边)。将此导入到 ArcTime,边听边手动插入到对应的时间轴上,就完工了。整个过程是机械的,具体操作可参考官方视频,大家可以想象一下太鼓达人的游戏。
讯飞听见字幕
💰 0.48元/分钟
💻 官网:https://zimu.iflyrec.com/index.html
对于没有脚本的 vlog 类型的视频,想到哪说到哪,完全没有文字稿,推荐【听见字幕】。良心的价格,95%的准确率,智能识别去掉【嗯、呃、啊】之类的语气词。除了中英文混合识别稍微差一点,其它没什么可以挑剔。对于新注册用户有免费2小时的体验券,15天有效期。假设平均一期视频10分钟,也能制作12只(但还是要注意15天有效期)。
我因为懒得玩“太鼓达人”,大多数视频都是用讯飞听见字幕【机器字幕】,简单校对一下(差不多就是过一遍改下错别字)就直接上传到 YouTube,再利用 YouTube 自动翻译到繁体中文和英语。简单、方便、省心,也不贵。
当然已经拥有文稿的同学可以选择【字幕时间码匹配】,也就相当于 ArcTime 的工作;或者用【机器文稿】生成文稿以后自己用 ArcTime 匹配字幕时间。
小贴士:把视频单独导出一份音频格式上传识别,效果是一样的,但音频比视频更高效。
剪映
💰 免费
💻 官网:https://lv.ulikecam.com/
通常来说,移动版视频编辑软件自带的字幕制作功能是比较一言难尽的,比如【必剪】。但【剪映】的字幕识别还是挺让我意外的:最近的视频夹带了中英文,识别的准确率也达到90%(可能也是因为视频不长)。人工简单地修理掉一些语气词,结果还是比较令人满意的。至少对比听见字幕,剪映不需要花钱。
(平平无奇的)但是。
虽然剪映已经推出桌面版,但字幕的校对和修改过程却非常令人抓狂。因为目前桌面版对快捷键支持很差,导致效率低下,且非常不安全,几次输入 ctrl+Z 都让我万分担心之前的编辑都付之东流。并且剪映的字幕只能压嵌在视频中,不能单独导出成字幕文件,这就意味着无法让机器学习你的视频内容了。也不支持导入字幕文件,就不能自动制作中英双语字幕。
可持观望态度,期待桌面版的快捷键早日支持完善,并且可以把字幕文件单独导出。
双语字幕
字幕制作的过程在于:
1⃣️ 语音识别文字内容
2⃣️ 字幕时间码匹配
3⃣️ (自动或人工)翻译成其他语言
4⃣️ 压嵌到视频中(可选)
我在实际制作过程中,没有一个单独的软件可以包揽所有工作,总是需要在不同的软件之间切换,这也是我觉得不完美的地方。
所以让我们回头重新讨论一下双语字幕的必要性,除了(主观臆测)观众看起来爽一点以外,对于算法搜索和理解是没有帮助的。而对于确实需要双语观看的观众来说,一些浏览器插件可以轻松实现。同时从软件设计的角度考虑,我会希望字幕和视频剥离。
当然内心对双语字幕的视频制作者充满敬佩之心:每一个细节都不放过。
最后,感谢看到这里。祝你今天过得开心