根据字幕做视频摘要续集
我又继续做奇怪的小工具了。上一次做完了根据字幕做视频摘要之后,仍然不太满意,因为那个工具只是面向youtube的,对于本地的视频,或者是下载到本地的视频课程,仍然不够好用。所以我做了一些修改,已经发布到了github上
现在可以先通过coursera-dl下载整个课程,然后再通过字幕划出重点,生成复习用的视频摘要。
使用
- 需先下载课程视频和字幕文件
- coursera上的课程可以使用coursera-dl进行下载。注意其中的china-issues, 可能需要通过VPN才能正常访问国际互联网。
- 使用coursera-dl下载出现"HTTPError:400"问题,请参考此解决方案
- Youtube上的课程,例如OCW,可以使用youtube-dl进行下载。注意需要将对应的字幕也下载下来
- coursera上的课程可以使用coursera-dl进行下载。注意其中的china-issues, 可能需要通过VPN才能正常访问国际互联网。
- 将字幕文件处理成txt脚本
- 处理单个文件:
python sub2txt.py -i <subtitle file name>
- 处理整个目录:
python sub2txt.py -p <path>
- 处理单个文件:
- 手动编辑txt脚本,将你认为不重要的部分删除后保存,尽量不要修改txt文件名
- 按编辑后的txt脚本剪辑视频课程:
- 处理单个文件:
python clip_by_txt.py -t <txt file>
- 处理整个目录:
python clip_by_txt.py -p <path>
- 处理单个文件:
剪辑完成的视频将以summary_开头,存储在视频课程原位,并且附带有srt的字幕。
Demo
这是一个剪辑自coursera上的learning how to learn课程第一周第一课introduction-to-the-focused-and-diffuse-modes
其他
似乎用来剪辑电影也会很方便吧。
说到剪辑电影,我还发现了一个有趣的工具videogrep,与我做的工具类似,但他是在字幕中检索关键词或者使用正则表达式来检索,效果惊艳: All the instances of the phrase “time” in the movie “In Time”