您现在的位置是：首页 > Python

当前栏目

Python 人工智能 5秒钟偷走你的声音

Python 人工智能

2023-03-14 22:33:36 时间

Python 人工智能 5秒钟偷走你的声音

介绍

Python 深度学习AI - 声音克隆、声音模仿，是一个三阶段的深度学习框架，允许从几秒钟的音频中创建语音的数字表示，并用它来调节文本到语音模型，该模型经过培训，可以概括到新的声音。

环境准备与安装

原始英文版地址：

github.com/CorentinJ/R…

中文二次开发版（本文使用该版本）：

github.com/babysor/Moc…

pycharm环境下载：

www.jetbrains.com/pycharm/dow…

conda虚拟环境：

www.anaconda.com/products/in…

FFmpeg ：

github.com/BtbN/FFmpeg…

模型文件：

pan.baidu.com/s/1PI-hM3sn… 提取码 2021

在电脑系统上安装 FFmpeg 工具

下载zip压缩包连接为：github.com/BtbN/FFmpeg…

下载完成后将其解压到一个目录后在系统的环境变量中添加该目录

打开新的cmd中查看是否安装成功

ffmpeg -version

使用打开项目目录后，创建时使用conda的Python 3.9虚拟环境

创建完成后，在cmd中查看现有的虚拟环境，并进入刚刚创建的虚拟环境

conda env list

activate pythonProject1

进入环境后在进行安装pip所需依赖，并使用国内源进行安装实现下载加速

pip install -r requirements.txt -i pypi.tuna.tsinghua.edu.cn/simple

在虚拟环境下安装pytorch

pip install torch -i pypi.tuna.tsinghua.edu.cn/simple

回到pycharm中，将模型导入到项目目录下，把目录复制黏贴到项目中

修改一行代码，在 synthesizer/utils/symbols.py 文件中

修改为：
_characters = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz12340!'(),-.:;? '
复制代码

之后在terminal中启动工具箱

使用音频合成工具箱

猜你喜欢

广州利为携手润乾软件一同亮相Strata+Hadoop纽约站
R语言的三种聚类方法
听说你是做数据分析的?
美国联邦机构利用大数据的五个例子
大数据分析：川普赢定大选了?
都在做大数据，你上市了么？
大数据领域开源技术除了Hadoop你还知道哪些
实时计算和数据转换，为何Yelp弃用Storm和Heron，自建流处理器PaaStorm?
大数据下的技术运营：数据采集系统设计与实现
支付宝大数据找出5类最易上当骗局
大数据时代下的意图搜索个性化服务是关键
岱凯：领先的ICT解决方案和服务，助力企业赢在数字时代
5分钟GET一场清华大数据讲座实战应用案例干货
大数据时代保护个人隐私的5点建议
大数据如何影响商业决策
国双成中国首家赴美上市大数据企业，十一年创业的重要里程碑
Bossies 2016：最佳开源大数据工具
开发IoT设备必须考虑的四种挑战
8月份改变行业游戏规则的十款物联网新品
共享+结合大数据时代几个关键问题剖析

zl程序教程

当前栏目

Python 人工智能 5秒钟偷走你的声音

Python 人工智能 5秒钟偷走你的声音

相关文章