版本:3.0.1
大小:36.85 MB
环境:PC端
日期:2019- 12-4
自己需要在视频上添加字幕,但是不知道用什么软件可以实现?今天极速小编给大家推荐一款功能强大的字幕编辑软件:字幕大师。字幕大师可以识别音频文件中的声音,智能生成响应的字幕文本,无需重复打字,相当方便。是各位制作字幕视频的好帮手!
字幕大师是OKVoice旗下的产品,依托OKVoice强大的语音技术,可以获得较高的准确率。OKVoice作为国内人工智能行业的一员,拥有完全自主知识产权和顶尖的智能语音合成和语音识别技术。借助云计算平台和移动互联网技术,已推出了一系列语音服务,广泛应用在移动互联网、智能家电、可穿戴设备、车载导航、医疗、教育、呼叫中心等领域。拥有专业的产品研发团队,因此在软件的更新迭代上,能够更迅速、更高效地响应用户的需求:优化算法、音频降噪、提高识别率,第一时间将比较先进的语音识别技术落实在实际的应用上。响应速度、服务速度都能达到比较大化。
流程简介
知识基础
媒体文件首先,我们针对本应用场景约定一下,凡是包含声音数据的视频和音频文件,如mp3、wav、aac、mp4、mov、flv、wmv等,都称媒体文件。它们所包含的声音数据如果带有人声,就可以用来辅助字幕的制作。
软字幕/外挂字幕
假设有视频文件A,和字幕数据B。A的画面中不含有任何字幕信息,使用播放器播放时,只能够看到画面。此时,我们指定播放器去加载字幕数据B,根据A的播放时间,动态的在播放窗口中将字幕叠加到A的画面上。由于A的数据和B是分开存放的,并且我们可以控制B显示与否,以及显示的字体大小和样式,那么,我们就可以把B称为外挂字幕或如软字幕(这两种说法基本是完全等效的)。字幕数据B有多种存在形式,我们常见的是以文件形式保存的“SRT”、“ASS”文件,当然还有许多其他的格式,我们在这里就不过多描述了。由于外挂字幕的数据与媒体文件是分离的,所以我们可以很方便的修改编辑。
硬字幕
假设只有一个独立的视频文件C,使用播放器播放时,能看到画面中已经带有了字幕图像,并且无法控制字幕是否显示、无法更改字体大小和样式,那么这时,就可以称为是硬字幕。此时的字幕文字已经变为图像,成为了画面的一部分。所以一般来讲,硬字幕是基本无法修改的。
字幕压制
假设有原始视频文件和外挂字幕,我们通过一定的技术手段将他们转化为带有硬字幕的视频文件过程,就称为字幕压制。一般来说,字幕压制的本质就是视频转码,所以是一项比较耗时、考验电脑性能的工作。并且为了保证字幕的视觉质量,会有一定的技术难度。
字幕稿
假设媒体文件里的演讲有100句话,那么将这100句话的文字内容保存到纯文本文件里,就称为字幕稿。当然,字幕稿还有一些额外的要求:比如必须要断句,每句一行,每行字数不要过多,每行尽量不含有标点等。具体的要求视情况而定。
自动对齐字幕
首先,你要准备好媒体文件和字幕稿,将它们上传后,服务器会自动将字幕稿的每一句话对齐到媒体文件的音频上,你只要对少量对齐不准确的句子进行调整即可。自动对齐字幕在某些语言习惯里也称为“自动对轴”或“自动切轴”等。
自动生成字幕
直接将媒体文件上传,无需准备字幕稿,服务器会自动将媒体文件中的音频所包含的人声,识别为文字,并且与音频对齐。由于语音识别存在一定的失误率,所以接下来,你需要对结果中的文字内容进行校对,将一些不准确的句子对齐。
批量处理
如果你需要批量处理只能对齐或语音识别,可以创建批量任务,并且在批量任务管理界面查看进度。批量处理支持断点续传功能,所以即使在网络
不稳定的情况下,依然可以确保效果。
编辑现有文件
有些时候不能一次完成编辑,可以将当前任务保存成工程文件,方便今后继续编辑。或者你也可以选择SRT文件打开并编辑。
更新日志
1、全新界面,底层优化
2、新增工程项目,支持打开工程二次修改
3、可根据语音识别生成字幕
4、优化降噪算法
5、支持导入srt文件进行修改
6、支持字幕批量前置、批量后置
7、字幕修改支持上下行合并、删除行、切分、标记
8、优化时间轴操作
9、多任务管理功能优化,支持批量操作、单独操作