声音模拟TAG

VoxCPM 0.5B 可以多种方言 中文 英文

输入音频即可模拟发声

https://www.modelscope.cn/models/OpenBMB/VoxCPM-0.5B

# 1) 直接合成(单段文本)
voxcpm --text "Hello VoxCPM" --output out.wav

# 2) 声音克隆(参考音频 + 对应文本)
voxcpm --text "Hello" \
  --prompt-audio path/to/voice.wav \
  --prompt-text "reference transcript" \
  --output out.wav \
  --denoise

# 3) 批量处理(每行一段文本)
voxcpm --input examples/input.txt --output-dir outs
#(可选)批量 + 克隆
voxcpm --input examples/input.txt --output-dir outs \
  --prompt-audio path/to/voice.wav \
  --prompt-text "reference transcript" \
  --denoise

# 4) 推理参数(质量/速度)
voxcpm --text "..." --output out.wav \
  --cfg-value 2.0 --inference-timesteps 10 --normalize

# 5) 模型加载
# 优先使用本地路径
voxcpm --text "..." --output out.wav --model-path /path/to/VoxCPM_model_dir
# 或从 Hugging Face 自动下载/缓存
voxcpm --text "..." --output out.wav \
  --hf-model-id openbmb/VoxCPM-0.5B --cache-dir ~/.cache/huggingface --local-files-only

# 6) 降噪器控制
voxcpm --text "..." --output out.wav \
  --no-denoiser --zipenhancer-path iic/speech_zipenhancer_ans_multiloss_16k_base

# 7) 查看帮助
voxcpm --help
python -m voxcpm.cli --help

CMD中 使用 python -m voxcpm.cli 替换前面的voxcpm

克隆声音的范例

python -m voxcpm.cli --text "你好你在干什么啊" --prompt-audio a.wav --prompt-text "你好 现在是几点钟了 明天又是什么时候呢 大家 都在上班还是上学" --output out.wav --denoise

web测试页面

去:GitHub – OpenBMB/VoxCPM: VoxCPM: Tokenizer-Free TTS for Context-Aware Speech Generation and True-to-Life Voice Cloning

下载下来后,进入文件目录 执行python app.py即可运行

http://localhost:7860

发表回复