C
T O P
Image

Other

autosub魔改版

此版本的autosub经过多人修改,并非pypi仓库版本。

  • By - C灵C

  • 2019年11月25日 23:18





转载的项目地址:

https://github.com/BingLingGroup/autosub/tree/alpha




Autosub是一个字幕自动生成工具。

它能使用Auditok来自动检测语音区域,通过ffmpeg根据语音区域来切割音频,通过Google-Speech-v2(Chrome-Web-Speech-api)将语音转为文字,以及通过py-googletrans将字幕文本翻译。目前暂时不支持最新的Google Cloud API。



Windows安装:

打开以下链接,下载Windows的最新发布版

https://github.com/BingLingGroup/autosub/releases/download/0.5.2-alpha/autosub-0.5.2-alpha-win-x64-pyinstaller.7z



以管理员身份  打开PowerShell(右键左下角Win图标)


安装chocolatey:

Set-ExecutionPolicy Bypass -Scope Process -Force; iex ((New-Object System.Net.WebClient).DownloadString('https://chocolatey.org/install.ps1'))


安装依赖:

choco install python2 curl ffmpeg -y








使用方法:

在调用谷歌api的过程中需要使用全局代理模式(科学上网)


音频预处理

仅音频预处理。

autosub -i 输入文件 -ap

音频预处理只是处理过程中的一部分。

autosub -i 输入文件 -ap y ...(其他选项)

 


检测语音区域,使用Auditok检测语音区域。

仅得到时间轴。

autosub -i 输入文件

得到时间轴只是处理过程中的一部分。

autosub -i 输入文件 -of regions ...(其他选项)




分割音频,根据语音区域得到音频片段。

根据自动语音区域检测,只获取音频片段。

autosub -i 输入文件 -ap s

根据外部语音区域输入,只获取音频片段。

autosub -i 输入文件 -ap s -er 时间轴字幕

获取音频片段只是处理过程中的一部分。

autosub -i 输入文件 -k ...(其他选项)




语音转录为字幕,语音音频片段转为语音语言字幕。

仅得到语音语言字幕。

autosub -i 输入文件 -S 语言代码

得到语音语言字幕只是处理过程中的一部分。

autosub -i 输入文件 -S 语言代码 -of src ...(其他选项)




翻译字幕,将字幕翻译为别的语言。

从音频/视频文件翻译字幕。

autosub -i 输入文件 -S 语言代码 (-Src 语言代码) -D 语言代码

从字幕文件翻译字幕。

autosub -i 输入文件 -Src 语言代码 -D 语言代码





查看使用帮助(各参数)

autosub -h

应用案例:提取文件夹内所有MP4文件的字幕

新建一个.bat批处理文件内容如下所示:

@echo off

set package_name=autosub.exe文件的绝对路径

set "file_name=需要提取字幕的文件所在的文件夹"

@echo on

for /r "%file_name%" %%i in (*.文件后缀) do (

%package_name% -i %%i -S 中文语言代码

)

call cmd



例:

@echo off

set package_name=D:\autosub\autosub_pyinstaller\autosub.exe

set "file_name=C:\Users\Administrator\Desktop\demo"

@echo on

for /r "%file_name%" %%i in (*.mp4) do (

%package_name% -i %%i -S cmn-hans-cn

)

call cmd