检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
语音合成管理 创建TTS试听任务 获取TTS试听文件 创建TTS异步任务 获取TTS异步任务 设置TTS租户级自定义读法配置 获取TTS租户级自定义读法配置 删除TTS租户级自定义读法配置 修改TTS租户级自定义读法配置 语音同步合成WebSocket接口
示例5:语音合成管理 语音合成管理示例代码,详见MetaStudio数字人语音合成管理。 父主题: 应用示例
Web语音唤醒 产品预置了唤醒能力,详见预制唤醒能力,如果用户需要更新唤醒词,需要参考定制唤醒能力处理。唤醒模型定制完成后,产品会提供给用户,用户需要参考更新唤醒模型,将模型更新至本地模型路径中。 使用要求 WebSDK版本为3.0.1及以上。 仅支持数字人平台配置或内置ASR(
意协议。单击“确定”,开通按需计费。开通后的效果如图1所示。 如需使用第三方声音进行语音合成,请购买出门问问声音套餐。 图1 声音合成 功能介绍 该接口用于TTS流式合成音频,用于文本转化为语音,并实时返回合成的音频数据。 调用方法 构造请求 请求URL:wss://metastudio-api
提交语音训练任务 功能介绍 提交训练任务,执行该接口后,任务会进入审核状态,审核完成后会等待训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/jobs/{job_id} 表1 路径参数
删除语音训练任务 功能介绍 删除语音训练任务 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/voice-training-manage/user/jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。
查询语音训练任务详情 功能介绍 查询语音训练任务详情 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
第三方应用 从下拉框中选择“华为云CBS”。 需已完成配置对话机器人服务CBS。 应用名称 用户根据实际情况自定义即可。 问答机器人ID 输入问答机器人ID。可在CBS控制台“智能问题机器人”页面查看,详见图2。 CBS委托站点 从下拉框中选择站点,即用户购买CBS问答机器人所在Region。
配置对话机器人服务CBS 在对话机器人服务配置问答机器人。MetaStudio创建对话时,如果“第三方应用”需要选择“华为云CBS”时,才需要执行本节操作,详情请参考表1。 操作步骤 登录MetaStudio控制台。 单击界面左上角的图标,在弹出的浮动框中,搜索“对话机器人服务 CBS”。
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
示例7:语音同步合成WebSocket接口(iOS SDK) 语音同步合成WebSocket接口示例,详见语音同步合成iOS SDK。 父主题: 应用示例
获取语音文件上传地址 功能介绍 获取语音文件上传地址 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs/{job_id}/uploading-address-url 表1 路径参数 参数
获取语音训练任务审核结果 功能介绍 获取语音训练任务审核结果。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs/{job_id}/audit-result 表1 路径参数 参数 是否必选
数字内容生产线(MetaStudio)解决方案,提供数字人视频与直播、智能交互等服务,使能千行百业场景应用。 应用场景 教育:数字人课件制作、虚拟老师教学。 政府及公共事业:数字人代言、数字人宣讲、数字人会议等。 医疗健康:智能医疗客服、虚拟医生培训等。 金融:数字人智能客服、数字人企业代言、数字人培训视频制作等。
Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 处理成功。 400 参数异常 500 服务端异常 错误码 请参见错误码。 父主题: 语音合成管理
务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。 如需使用第三方声音进行语音合成,请购买出门问问声音套餐,操作请参考《用户指南》的“购买出门问问声音套餐”章节。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsc/async-jobs
Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 处理成功。 400 参数异常 500 服务端异常 错误码 请参见错误码。 父主题: 语音合成管理
Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 处理成功。 400 参数异常 500 服务端异常 错误码 请参见错误码。 父主题: 语音合成管理