模块介绍

文本部分核心功能时将文本输入，转化为音频，字幕等文件。

前置准备

运行需要本地推理生成音频的服务（目前包括GPT-SoVITS、Fish-Speech、ChatTTS），需要本地电脑配置有一定要求并且已启动对应的服务，且服务配置的对应端口号及配置信息都和本地启动一致，否则在使用相关功能时会失败。
具体要改的配置有模型中的文本大模型、音频大模型，关于各模态大模型的启动部分，可参考各大模型的集成。

操作步骤

文本转语音

平台利用多种先进的AI模型，包括GPT-SoVITS、Fish-Speech、ChatTTS和Edge-TTS，为小说中的对话和角色生成高质量的语音。用户可以上传文本内容，在操作界面进行章节拆分，并为每个角色生成相应的语音配音。

使用的技术

GPT-SoVITS
Fish-Speech
ChatTTS
Edge-TTS

未来计划

······

贡献与反馈

欢迎对本项目进行贡献和反馈。如有任何问题或建议，请通过以下方式联系我们：

GitHub Issues
邮件：liuwenliang001@163.com
QQ讨论群：751706992

感谢您的支持与参与！

参考资料