您现在的位置是：首页 > 后端

当前栏目

Python 人工智能 5秒钟偷走你的声音

Python 人工智能声音秒钟

2023-06-13 09:11:16 时间

介绍

Python 深度学习AI - 声音克隆、声音模仿，是一个三阶段的深度学习框架，允许从几秒钟的音频中创建语音的数字表示，并用它来调节文本到语音模型，该模型经过培训，可以概括到新的声音。

环境准备与安装

原始英文版地址：

https://github.com/CorentinJ/Real-Time-Voice-Cloning

中文二次开发版（本文使用该版本）：

https://github.com/babysor/MockingBird

pycharm环境下载：

https://www.jetbrains.com/pycharm/download/#section=windows

conda虚拟环境：

https://www.anaconda.com/products/individual

FFmpeg ：

https://github.com/BtbN/FFmpeg-Builds/releases

模型文件：

https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ 提取码 2021

在电脑系统上安装 FFmpeg 工具

下载zip压缩包连接为：https://github.com/BtbN/FFmpeg-Builds/releases/download/autobuild-2021-11-09-12-23/ffmpeg-N-104488-ga13646639f-win64-gpl.zip

下载完成后将其解压到一个目录后在系统的环境变量中添加该目录

打开新的cmd中查看是否安装成功

ffmpeg -version

使用打开项目目录后，创建时使用conda的Python 3.9虚拟环境

创建完成后，在cmd中查看现有的虚拟环境，并进入刚刚创建的虚拟环境

conda env list

activate pythonProject1

进入环境后在进行安装pip所需依赖，并使用国内源进行安装实现下载加速

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

在虚拟环境下安装pytorch

pip install torch -i https://pypi.tuna.tsinghua.edu.cn/simple

回到pycharm中，将模型导入到项目目录下，把目录复制黏贴到项目中

修改一行代码，在 synthesizer/utils/symbols.py 文件中

修改为：
_characters = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz12340!'(),-.:;? '

之后在terminal中启动工具箱

使用音频合成工具箱

猜你喜欢

jquery插件开发之实现jquery手风琴功能分享
【Android 应用开发】Canvas 精准绘制文字 ( 测量文本真实边界 | 将文本中心点与给定中心点对齐 )
asp由动态网页转变为静态网页的实现代码
现代Linux系统中启用防火墙的步骤（linux开关防火墙）
Redis 实现高效的数据更新（redis数据更新）
Win32/AutoRun.Agent.NZ 蠕虫感染文件的简单分析和修复
“不再独家”之后，数字音乐平台轻装上阵
通过手机传感器嗅探用户输入的密码
服务优化ELK和Redis服务体验指南（elkredis）
六西格玛常用工具汇总
统计SQL Server中的金额统计与分析（sqlserver 金额）
ORA-28044: unsupported directory type ORACLE 报错故障修复远程处理

zl程序教程

当前栏目

Python 人工智能 5秒钟偷走你的声音

相关文章