直播界风起云涌,如今很多大主播的号召力已经不亚于三四线小明星,比如陈一发。相信很多人都知道,相信很多人也看过这个视频:主播真会玩鬼畜篇08:暴击女王陈一发。像我这样的中老年人其实对 B 站和鬼畜都不怎么感冒,不过对这种视频的传播效力很感兴趣。
今天百度发布了分词产品,虽然我很讨厌百度,但不得不说这个分词产品和它的语音合成产品都给我们这些不会语音合成的开发者创造了新的可能,算是百度积累的一件功德,略微降低了我对它的恶感。
接下来介绍的这个 idea 我其实琢磨一阵子了,它是一个工具,可以用来合成任意鬼畜视频。工作流程如下:
- 抓取直播视频,提取音频文件。现在大主播都有回看功能,应该不难。
- 把音频文件切割后,利用百度语音转换成文字。切割主要根据停顿,方便识别句子。
- 把时间点和文字入库备用。
- 选择一首歌,或者自己写个段子
- 使用 ES 之类的工具,检索出匹配度最高的句子;也可以使用百度分词工具,分词,查找最匹配的段落
- 合成结果类似:
白日依山尽 ( 2018-01-01 1.mp4,10:10:10-10:10:25)
黄河(2018-01-02 2.mp4, 10:10:12-10:10:15) 入海流(2018-01-02 3.avi,10:15:22-10:15:35)
欲穷千里目(无匹配)
更上一层楼(4.flv,0:0:15-0:0:35|5.mp4, 1:1:1-1:1:20) - 纯文本文件,方便保存和版本管理
- 合成结果类似:
- 人工预览一遍,对个别词进行调整
- 自动裁剪拼接配乐输出视频
- 完成
这样一来,即使主播本人未播过的歌曲,也可以根据素材合成出来,比如 陈一发儿:~老公~要抱抱~要亲亲~嗯~人家要嘛~
目前这里面所有步骤都可以使用工具和比较简单的开发语言完成,如果你想积攒编程经验,又无从下手,且喜欢看各种女主播,这个 idea 就不妨拿去一试。
欢迎吐槽,共同进步