声音模拟TAG

声音模拟TAG

VoxCPM 0.5B 可以多种方言中文英文

输入音频即可模拟发声

https://www.modelscope.cn/models/OpenBMB/VoxCPM-0.5B

# 1) 直接合成（单段文本）
voxcpm --text "Hello VoxCPM" --output out.wav

# 2) 声音克隆（参考音频 + 对应文本）
voxcpm --text "Hello" \
  --prompt-audio path/to/voice.wav \
  --prompt-text "reference transcript" \
  --output out.wav \
  --denoise

# 3) 批量处理（每行一段文本）
voxcpm --input examples/input.txt --output-dir outs
#（可选）批量 + 克隆
voxcpm --input examples/input.txt --output-dir outs \
  --prompt-audio path/to/voice.wav \
  --prompt-text "reference transcript" \
  --denoise

# 4) 推理参数（质量/速度）
voxcpm --text "..." --output out.wav \
  --cfg-value 2.0 --inference-timesteps 10 --normalize

# 5) 模型加载
# 优先使用本地路径
voxcpm --text "..." --output out.wav --model-path /path/to/VoxCPM_model_dir
# 或从 Hugging Face 自动下载/缓存
voxcpm --text "..." --output out.wav \
  --hf-model-id openbmb/VoxCPM-0.5B --cache-dir ~/.cache/huggingface --local-files-only

# 6) 降噪器控制
voxcpm --text "..." --output out.wav \
  --no-denoiser --zipenhancer-path iic/speech_zipenhancer_ans_multiloss_16k_base

# 7) 查看帮助
voxcpm --help
python -m voxcpm.cli --help

CMD中使用 python -m voxcpm.cli 替换前面的voxcpm

克隆声音的范例

python -m voxcpm.cli --text "你好你在干什么啊" --prompt-audio a.wav --prompt-text "你好 现在是几点钟了 明天又是什么时候呢 大家 都在上班还是上学" --output out.wav --denoise

web测试页面

去：GitHub – OpenBMB/VoxCPM: VoxCPM: Tokenizer-Free TTS for Context-Aware Speech Generation and True-to-Life Voice Cloning

下载下来后，进入文件目录执行python app.py即可运行

http://localhost:7860

此条目发表在None分类目录。将固定链接加入收藏夹。

克隆声音的范例

web测试页面

发表回复取消回复

近期文章

近期评论

归档

分类

友情链接

其他操作

声音模拟TAG

克隆声音的范例

web测试页面

发表回复 取消回复

近期文章

近期评论

归档

分类

友情链接

其他操作

发表回复取消回复