批量文字转语音(带字幕生成)

一个基于讯飞开放平台API的批量文本转语音工具,提供友好的图形用户界面,支持批量处理文本文件并生成MP3音频和SRT字幕文件。
功能特点
批量处理:支持批量处理txt文本文件(每行一段文本)
高质量音频:基于讯飞开放平台,生成高质量MP3音频
自动字幕:自动生成SRT格式字幕文件,支持时间轴同步
参数调节:支持语速调节(0.1-5.0倍速)
句间停顿:可设置句子之间的停顿时长
文本预处理:可选去除文本中的空格
实时进度:显示处理进度和详细日志
前置条件
2. 注册账号并创建应用
3. 开通"实时语音转写"服务
4. 获取APPID、API Secret和API Key
//讯飞现在有免费额度1万次(企业2万次),个人和企业只要进行简单认证即可领取。
//作者测试时,转写100条音频(每段字30字以内),消耗约200左右,理论上可以合成上5000+条音频。
参数说明
语速:控制语音播放速度
句间停顿:设置句子之间的停顿时长
文本预处理:去除文本中的空格字符
生成字幕:自动生成SRT格式字幕文件
基础字符持续时间:影响字幕时间轴计算
软件界面
批量文本转语音
下载地址
本内容需要登录后查看
阅读剩余
THE END