Skip to content

🎙️ 语音功能使用说明

基础语音功能 VITS 使用

  • 若要使用 Vits 语音功能,Windows 用户请下载链接程序simple-vits-api,Linux 用户请见官方文档,安卓用户......别想了性能太差基本用不了。
  • 该项目实现了基于 Vits 的简单语音合成 API。如果你是核显只能下载CPU版本。如果有独显建议下载 GPU 版本,速度快。
  • 程序默认监听 23456 语音端口,程序默认导入的模型是 ZcChat 地址 -> 讨论区 -> 角色示范(丛雨)-> YuzuSoft_Vits.zip
  • 模型下载好之后将压缩包 YuzuSoft_Vits.zip 解压到 simple-vits-api 的/data/models 目录下,再双击根目录下的 start.bat 启动就 ok 了
  • 如果需要使用其他角色声线,请在 game_data/characters/角色名/settings.txt 中修改 speaker_id 这个属性(0~6可选)

NOTE

  1. 视频演示中的灵灵,语音使用的是Style-Bert-Vits2,丛雨的vits模型还需要打磨暂未发布,可以先用Simple-Vits-API,效果差不多
  2. 视频中的音理,请在Discussions区下载人物包,语音请使用Style-Bert-Vits2
  3. 建议先使用Simple-Vits-API玩玩,国人开发下载方便,需要扩展再用Style-Bert-Vits2
  4. 经过反映,如果你的电脑是核显或者太久以前的电脑,单个语音可能要一分钟才能生成,而GPU可以1秒内生成,而且会有大量报错可能,核显用户大可能只能放弃语音功能了(哭哭)

扩展语音功能 Style-Bert-Vits2 使用

(Style-Bert-Vits2模型使用更好的音色,可自定义训练)

Windows

  • 从下方相关链接中,下载Style-Bert-Vits2的 Release最新版本 ,解压
  • 先决定这个软件(安装后12GB)的安装位置,然后启动里面的Install-Style-Bert-VITS2.bat文件(如果之后更改这个软件的位置会有Bug)
  • 耐心等待很长时间后,这个软件会安装好。由于这个项目庞大,所以等待时间非常长
  • 下载完毕后,在 model_assests 目录中,把下载好的Bert-Vits模型解压进去
  • 打开程序的目录,里面有个 server.bat ,启动它即可使用

TIP

要是想使用这个功能,需要在 game_data/characters/<角色名>/settings.txt 中设定 model_name 的参数为导入的模型的名字
模型的名字可以通过启动app.bat中的人物列表中查看

Linux

运行以下命令安装:

bash
git clone --depth 1 https://ghfast.top/github.com/litagin02/Style-Bert-VITS2.git
cd Style-Bert-VITS2
uv venv venv
venv\Scripts\activate
uv pip install "torch<2.4" "torchaudio<2.4" --index-url https://download.pytorch.org/whl/cu118 #用于GPU合成,CPU请把后面的 cu118 换成 cpu
uv pip install -r requirements.txt
python initialize.py

下载完毕后,在 model_assests 目录中,把下载好的Bert-Vits模型解压进去

运行以下命令启动:

bash
python server_fastapi.py

TIP

要是想使用这个功能,需要在 game_data/characters/<角色名>/settings.txt 中设定 model_name 的参数为导入的模型的名字
模型的名字可以通过运行 python app.py 查看人物列表