请选择 进入手机版 | 继续访问电脑版
 找回密码
 立即注册
查看: 452|回复: 5

为了更便捷的手抄字幕, 我搞了一个新玩具

  • TA的每日心情
    开心
    2019-4-4 17:54
  • 签到天数: 2 天

    [LV.1]初来乍到

    10

    主题

    34

    帖子

    1125

    VC币

    至尊会员

    Rank: 16Rank: 16Rank: 16Rank: 16

    积分
    290300
    NoobNeo 发表于 2019-8-11 22:37:01 | 显示全部楼层 |阅读模式
    提取硬字幕, 就是对着视频把字幕一个个敲下来做成外挂字幕.
    普遍用esrXP做提取工作, 这软件从05年就不更新, 兼容性不好, 其他的提取软件多数是需要idx/sub字幕, 用OCR处理成ass/srt, 与需求不符.
    经过几次手抄后, 觉得esrXP不好用, 万一系统重装(bug10的日常), 又要重新整环境, 很多人就放弃了这个软件, 然后我就利用闲暇时间整了个玩具, 姑且叫"Caption OCR Tool"(Abbr. COCR).
    放几张图看看, 顺便比对下esrXP



    左边: COCR; 右边: esrXP

    附上软件试试? 现在连β版本, 呸 α版都算不上, 就不拿出来了.
    稍微介绍下, 项目是java语言, 基于opencv, ffmpeg, tesseract等开源项目.
    esrXP基本实现方式:
    1. 通过HSL实现字幕过滤的, 整体干扰物(无用的竖线, 噪点)少, 需要考虑字体/描边颜色;
    2. 去除干扰物的方法不明, 可以手动去除;
    3. 时间轴应该是基于帧的, 提取间隔估计在3~5帧;
    4. 重复帧的处理方式不明;
    5. OCR? 提取字幕图片后导出, 再利用其它软件识别.
    COCR基本实现方式:
    1. 通过形态学算法实现字幕过滤的, 整体干扰物多, 文字区域少, 忽略颜色信息;
    2. 利用连通区域填充去除干扰物, 不能手动去除;
    3. 时间轴是基于帧的, 提取间隔可选1~5帧;
    4. 重复帧是通过SSIM或PSNR算法去除的;
    5. 通过Tesseract实现的, LSTM网络(RNNs的一种), 把论坛的字体包过了一遍, 简体字错误率3%, 繁体字10%, 日文10%, 我已经尽力了...心累
    其实用Tensorflow + CNN组合更好, 不过调用失败, 神经网络这方面的知识不够, 只好放弃.
    esrXP运行的时候占用内存极低, 才几十M; COCR根据视频大小, 经过优化还是需要1G+的内存, 最初动不动就OOM(内存溢出), 跟其他人交流后, 基本都遇到过视频过大就OOM的问题, 感叹esrXP用的什么黑科技如此省资源.

    如果有好的建议, 请不要吝惜, 发给我吧, 软件我会在优化测试结束后, 发到论坛上的, 但只有我一个人, 平时也没太多时间, 咕咕咕...

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?立即注册

    x

    评分

    参与人数 10活跃度 +179040 收起 理由
    mung + 12800
    Whatsuperhere + 400 赞一个!
    CLANNADAO + 400 很给力!
    hungry小浩纸 + 1600
    kavenliang + 10240
    WengChiew + 25600 很给力!
    贽殿遮那 + 32000 期待一下
    haiyang + 32000 加油!
    Seekladoom + 32000 只要能做出来就是好事!慢点来吧!.
    tonyhsie + 32000 希望能越做越好 加油

    查看全部评分

    有想手抄的番或者以往字幕有问题的, 可以联系我.
    唯一联系方式 Telegram: @noobneo
    回复

    使用道具 举报

    该用户从未签到

    18

    主题

    186

    帖子

    1850

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    969032

    崭露头角活跃达人新人登场渐入佳境

    haiyang 发表于 2019-8-12 00:04:09 | 显示全部楼层
    太强大了  支持一下
    百合は正義!
    即将开坑:扩张少女
    宣传:欢迎想手抄但又没精力的朋友一来手抄呀  蜜汁号码
    “530605543”
    esrXP操作手册:http://bbs.vcb-s.com/thread-3809-1-1.html
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    1

    主题

    11

    帖子

    5

    VC币

    白金会员

    Rank: 12Rank: 12Rank: 12

    积分
    64180
    3j29cd 发表于 2019-8-12 00:11:38 | 显示全部楼层
    內存boom了 java應該也有貢獻原因
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    昨天 15:15
  • 签到天数: 347 天

    [LV.8]以坛为家I

    12

    主题

    47

    帖子

    60

    VC币

    至尊会员

    Rank: 16Rank: 16Rank: 16Rank: 16

    积分
    205051

    崭露头角

    KarlZeo 发表于 2019-8-12 12:00:46 | 显示全部楼层
    众所周知,java是吃内存的大户.
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-4 17:54
  • 签到天数: 2 天

    [LV.1]初来乍到

    10

    主题

    34

    帖子

    1125

    VC币

    至尊会员

    Rank: 16Rank: 16Rank: 16Rank: 16

    积分
    290300
    NoobNeo  楼主| 发表于 2019-8-12 22:09:24 | 显示全部楼层
    3j29cd 发表于 2019-8-12 00:11
    內存boom了 java應該也有貢獻原因

    opencv 采集产生大量数据, 弃用后没有及时被回收释放, 最终就 boom 了
    有想手抄的番或者以往字幕有问题的, 可以联系我.
    唯一联系方式 Telegram: @noobneo
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    郁闷
    2019-8-10 00:59
  • 签到天数: 30 天

    [LV.5]常住居民I

    8

    主题

    102

    帖子

    46

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    6523

    崭露头角

    孤雨独火 发表于 2019-8-12 23:02:41 | 显示全部楼层
    哇,以前看到现在esrxp还有大把人用就觉得不可思议,现在算是快有可靠的替代品了嘛
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    VCB-Studio分享论坛X

    VCB-S微信公众号上线了,欢迎关注!

    欢迎关注VCB-S微信公众号,公众号将不定期推送有关本组最新资源的消息。...

    点击查看详情 
    快速回复 返回顶部 返回列表