开发者空间实践指导:基于3大PaaS主流服务轻松实现文字转换语音

举报
华为云PaaS服务小智 发表于 2024/08/23 14:34:28 2024/08/23
【摘要】 基于CodeArts API设计语音合成接口,基于API Explorer调试接口,并利用CodeArts IDE实现数据流转换为音频

案例简介

开发者将在云主机中,基于CodeArts API设计语音合成接口,基于API Explorer调试接口,并利用CodeArts IDE实现数据流转换为音频。在此过程中,开发者可体验API设计、开发、调试等全生命周期,对华为云产品API体系及API开放能力有全面了解,并最终完成应用创建,全程实践约15分钟。


配置开发者空间

华为云为全球开发者打造专属开发者空间,汇聚了华为优质开发资源及工具,让每一位开发者拥有一台云主机。

在华为开发者空间,每位开发者每年可享有数百小时的云主机使用时长,5GB的云存储空间和场景化沙箱资源,以及海量的技术赋能课程与专业开发者认证内容。

点此领取:https://auth.huaweicloud.cn/authui/login.html?service=https%3A%2F%2Fdeveloper.huaweicloud.cn%2Fspace%2Flogin-forword.html%3FforwardUrl%3Dhttps%253A%252F%252Fdeveloper.huaweicloud.cn%252Fspace%252Fhome%26module%3Dhuaweideveloper&locale=zh-cn#/login

1.进入开发者空间,点击“云主机(beta体验)”


2.点击“添加云主机”

3.点击“立即进入”

4.点击“下一步”


5.继续点击“下一步”

6.点击“进入桌面”

7.等待机器准备进度条加载完成至100%,预计等待1分钟,然后点击打开云桌面即可使用

 

通过CodeArts API设计语音合成接口


3.1     进入CodeArts API官网,打开左边工具栏-Firefox网络浏览器,输入网页版体验地址并登录

https://developer.huaweicloud.cn/develop/codeartsapi.html

3.2     创建项目

3.2.1    登录后点击页面右上角的“创建项目”按钮


3.2.2    在创建项目弹窗中输入项目名称:语音合成,并点击保存

3.2.3    提示保存成功,点击API设计页签,进入到API设计页面


3.3     设计接口

3.3.1    点击页面上的“新建API接口”卡片

3.3.2    显示新建标签页

3.3.3    输入接口的URL/tts

3.3.4    输入接口名称:语音合成


3.3.5    下拉滚动条到请求参数区域,点击请求体“Body”页签,选择“raw”,默认选择“JSON”格式。


 

3.3.6    显示请求体的数据结构模板,默认根节点类型为“object


3.3.7    点击根节点最右侧的“+”操作


3.3.8    页面上在根节点下新增一条参数(可以通过滚动条左右拖动)


3.3.9    将参数名param2修改为text,描述param2修改为待合成的文本

3.3.10 下拉页面,看到返回响应区域

3.3.11 同样点击根节点最右侧的“+”操作(可以通过滚动条拖动到最右侧),在根节点下显示一条新的参数

3.3.12 将参数名param2修改为result,将描述修改为合成结果

3.3.13 点击右上角的保存按钮

3.3.14 保存成功,设计完成


通过API Explorer调试语音合成接口,生成5段数据流

4.1     语音合成(API Explorer部分):

链接:https://console.huaweicloud.cn/apiexplorer/#/openapi/SIS/debug?api=RunTts


4.1.1    生成语音格式为wav,采样率:8000,标准女音,语速0,音色0

1.1.1 wav标准女音


4.1.2    生成语音格式为wav,采样率:16000,标准男声,语速0,音色0

1..12 wav标准男音


4.1.3    生成语音格式为mp3,采样率:8000,标准女音,语速100,音色100

1.1.3 mp3标准女音

 


4.1.4    生成语音格式为mp3,采样率:16000,标准男声,语速100,音色100

1.1.4 mp3标准男声


4.1.5    生成语音格式为pcm,采样率:16000,标准男声,语速100,音色100

1.1.5 标准男声


在开发者空间基于华为云自研CodeArts IDE,实现数据流转换为音频的功能

5.1     实现数据流转换为音频

5.1.1    将实验用Demo工程上传到CodeArts IDE

打开右侧工具栏-Firefox网络浏览器,输入并访问Demo工程下载链接:

https://sandbox-expriment-files.obs.cn-north-1.myhuaweicloud.com/2601/CodeArtsProject.zip

对下载好的文件进行解压(目录:主文件夹/下载),右键提取到此处

打开CodeArts IDE,左上角点击“工程”->“打开工程”,选择刚刚解压出来的文件夹,打开:

 

预计等待1分钟左右的时间,工程模型同步成功:


5.1.2    在华为云控制台新增访问秘钥,配置AK/SK

1)登录华为云控制台:https://console.huaweicloud.cn/iam/?agencyId=599e2ee1492f48e9b69a0a682d435fb8&region=cn-north-4&locale=zh-cn#/mine/accessKey

选择“我的凭证”->“访问秘钥”->新增访问秘钥

注:如果已经有AK/SK秘钥,不需要新增访问秘钥

创建秘钥成功后点击“立即下载”,即可获得“credentials.csv”文件,里面可以查看到AKAccess Key Id)和SKSecret Access Key


2)进入工程,src/main/resources下选择credentials.properties,将AK/SK配置上


5.1.3    将API Explorer上调试成功的流数据文件配置到APIResponse.json

2.1语音合成章节,我们在API Explorer完成接口的调试

https://console.huaweicloud.cn/apiexplorer/#/openapi/SIS/debug?api=RunTts

最终生成“SIS_RunTts_ResponseBody_xxxxxxxxxxxxx.json”文件,打开json文件,复制响应体内容(如果响应体内容没有超出限制,直接点击右侧的复制按钮即可)

打开工程,进入src/main/resources中,选择APIResponse.json,将json文件的内容复制到APIResponse.json中。

5.1.4    配置pom.xml

pom.xml中如图所示,增加如下配置:

  <properties>

        <java.version>17</java.version>

        <maven.compiler.source>17</maven.compiler.source>

        <maven.compiler.target>17</maven.compiler.target>

  </properties>

5.1.5    执行“should_return_audio_when_response_json”,生成mps格式音频文件:

找到test目录下的测试类SisServiceTest.java,点击找到方法“should_return_audio_when_response_json()”,点击执行测试,最后可以看到目录下生成的音频文件。

目录下生成“devkit.mps”文件,实验结束。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。