编辑点评:AI语音智能识别克隆工具
开源免费的AI语音克隆工具,只需要5秒钟就可以轻松克隆出你的声音,MockingBird软件很神奇,可以根据任意文字克隆出你的声音,听起来就像是你在说这段文字一样,很多用户觉得安装麻烦,特意分享MockingBird绿色整合版,欢迎免费下载。
软件特色
一个实时克隆中文声音的AI工具,只需5秒,就能用AI 技术来模拟声音来生成任意语音内容。程序依赖Python、Pytorch、FFmpeg等库,如下快速开始文档有详细介绍。可以下载预训练好的合成模型(synthesizer),也可训练自己的合成模型。从体验和视频demo上看,确实能复制目标用户的音色,不过生成的效果也不是特别理想,可能需要针对性的训练效果会更好些。
操作步骤
1.record,录入声音
2.自动加载模型
3.写一段文本
4.等待生成
5.播放、导出录音文件
绿色版说明
绿色整合版,无需手动安装python,开箱即用,打开运行.bat即可
五秒克隆你的声音
已整合训练好的模型,不需要特别高的配置和IT水平
环境要求
python3.7及以上
理论支持Windows 7及以上 (建议 win8+,过老版本不保证兼容性)
亲测win2012,win10完美运行
如果在用 pip 方式安装的时候出现 ERROR: Could not find a version that satisfies the requirement torch==1.9.0+cu102 (from versions: 0.1.2, 0.1.2.post1, 0.1.2.post2) 这个错误可能是 python 版本过低,3.9 可以安装成功。
软件亮点
1、中文 支持普通话并使用多种中文数据集进行测试:aidatatang_200zh, magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell 等
2、PyTorch 适用于 pytorch,已在 1.9.0 版本(最新于 2021 年 8 月)中测试,GPU Tesla T4 和 GTX 2060
3、 Windows + Linux 可在 Windows 操作系统和 linux 操作系统中运行(苹果系统M1版也有社区成功运行案例)
4、Easy & Awesome 仅需下载或新训练合成器(synthesizer)就有良好效果,复用预训练的编码器/声码器,或实时的HiFi-GAN作为vocoder
5、Webserver Ready 可伺服你的训练结果,供远程调用。
安装教程
请勾选add python to path,否则需要手动配置环境变量
请保持网络畅通,若断网报错请重新执行安装依赖.bat
使用教程
1.browse选择一段3-15秒的语音,wav格式,最好单声道,吐字清晰,没有杂音,不宜过长
亲测网课直播录屏,发语音,在安静条件录音等音质较好,而在公共环境比如舞台,KTV等录音音质较差
不是所有语音都能够完美克隆,亲测在网课放老师的声音以假乱真,但像麦小兜派蒙雷米等萝莉音效果不理想
可以使用音频编辑工具例如au进行预处理降噪
如图所示,频谱规则的音频克隆效果较好
2.在右上角输入文本,仅支持中文,不要有阿拉伯数字,英文请使用谐音自行解决哈
3.选择vocoder,推荐Griffin-Lim,点击Synthesize and vocode试听,之后点击export导出音频
Android RMX1991支持( 0 ) 盖楼(回复)