蓝光字幕提取及处理.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蓝光字幕提取及处理

sup部分 1.提取 工具:“tsmuxer”,命令行或gui界面。以gui界面为例: 这里分离出了1个“264文件”即视频;1个“ac3音频”即音轨;另外一个就是本教程的主角“sup文件”即字幕文件。Sup文件为BDMV及HDDVD高清媒体专用字幕格式。不能直接avs加载,亦不能被常用视频压缩软件识别。须要转换成其他格式字幕文件。 2.处理 如何转换? 目前比较统一的思路是:sup to idx+sub to srt。 Sup to idx+sub: 这里分2种情况:sup字幕来自于hddvd以及bdmv 目前bdmv蓝光已经是绝对主流。以下已来自于蓝光盘的sup为例。 工具:“BDSup2Sub”,系统必须安装“java”软件。 安装java后,在cmd下,进入BDSup2Sub.jar所在目录。键入“java -jar BDSup2Sub.jar”或“javaw -jar BDSup2Sub.jar”。 File—Load 打开需要转换的sup文件: 然后: 例如: 为了提高识别率,可以移动字幕位置到黑边上,如图: 然后保存为idx+sub格式。 至此,我们就可以直接avs加载idx压制了。 然而idx+sub字幕是图片字幕,受限于字体等因素。可能导致画面看上去不太美观。那就可能需要把sub转换成srt文本字幕了。 srt部分 概念: 1. sub格式,由一个sub文件和一个idx文件组成。2. sub文件中其实是一幅幅背景透明的图片,而idx则是index文件,引导显示每幅图片的时间。. sub字幕不能直接转换,而是要通过一种叫OCR(Optical Character Recognition)的方法,也就是光学字符识别技术。SubToSrt” A。用SubRip将sub文件转换为bmp图片 首先安装SubRip,选择安装所有。打开SubRip-文件-打开Vob文件打开文件目录-选定sub-语言数据流选Chinese-右面操作里选字幕图片保存为4bit的BMP文件,以及在加时间和尺寸 上打勾-开始输入任意文件名-保存 预设里选I-Author-选取Custom Colors and Contrast-把颜色#1-4全部选择成白色(#1-4分别代表字芯、字框、背景、消除走样,每个字幕的#1-4所代表的都不一 样)-一一测试哪一个为字芯,设为黑色,其他3项全部为白色,重要! -点选确定 SubRip自动将每一幅图片保存为BMP,并且加上相应时间顺序 输出格式-设置输出格式-Text formats下的SubRip(*.srt)-转换成此格式 文件-另存为-保存 关闭SubRip SubToSrt 3.11的使用 1.绿色软件,直接解压开即可使用。 2. 运行SubToSrt.exe-文件-打开SRT或SSA文件-选取刚才保存的srt文件 3. 图片处理-自动裁剪-确定(推荐使用此步骤,可以使识别更快) 4. 依照字幕调节空格检测设置、空格宽度设置、行高检测设置的灵敏度 5. 识别-开始识别 当遇到不认识的字时,会自动跳出小窗 口要求丰富字库,输入该字,按回车即可 当遇到半个字的时候,如图,按扩展(Alt+E),即可显示全字 如果前面一个字打错, 可以在小框中修改该字,程序会自动从该字所在行开始识别 6. 识别完毕后,会自动替换已知错误词组。 7. 这时,可以随便看一下字幕,如有需要,可以略做修改(如:原sub字幕中就是错误的) 8. 文件-保存为SRT或SSA格式. 字幕修改校对 1. 文件-打开可对照的字幕文件-选取已经转换好的文件 2. 修改左面或者右面的字幕都可以,修改完毕后,点击保存IdxSubOcr”(个人建议使用) 所谓modi 即“Microsoft Office Document Imaging ”。(貌似只能在Microsoft Office 2003下调用,反正我的2010是怎样也打不开) 首先,必须安装Microsoft Office Document Imaging,建议在安装Microsoft Office 2003时候把全部组件选上。 然后,打开IdxSubOcr(绿色软件):如下图 然后: 然后,短暂的过程,相对于第一个方法来说快了不知多少倍了: 最后, 这种方法声称是目前识别率最高的,可达到98%。然而余下的2%也是需要耗费大量的时间修正的。所以,如果不是对字幕有苛刻的要求,建议直接采用idx+sub的图形字幕压制。

文档评论(0)

jgx3536 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档