检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
高品质:整段录制生成一个WAV或MP3格式音频,总时长1小时以上,建议1小时。 原声录制音频和其对应生成的音色播报示例,如客户声音制作案例所示。 录音准备 表1 录音准备 声音类型 录制设备和软件 录音环境 录音文案 基础版 优先使用专业录音设备录制音频,推荐使用Adobe Audition软件进行录音。
Integer 每页显示的条目数量。 取值范围: 1-100 默认取值: 10 sort_key 否 String 排序字段,支持的排序方式有: 按创建时间排序:create_time 按更新时间排序:update_time 按资产排序:asset_order sort_dir 否
表1 创建技能 参数 说明 技能名称 技能名称,必须与科大讯飞创建的技能一一对应,如在科大讯飞创建同名技能并导入技能文件所示。 为方便识别和记忆,两边的技能名称推荐相同。 技能标识 技能标识,必须与科大讯飞创建的技能标识保持一致,如在科大讯飞创建同名技能并导入技能文件所示。否则用户命中问题,也无法获取到正确的答案。
的音频文件,时长1小时以上,建议1小时。 每种声音制作方式后面都会展示剩余次数,需要保证剩余次数充足。录制过程中,每句之间有2~3秒的停顿。 其中,进阶版和高品质声音制作需要更多语料,训练时长更长,声音效果更佳。 请完善声音信息 输入声音名称。 示例:欢快女声。 须知: 声音训练完成后,可以在“我的创作
件的选中页面。 如果插入文件之前,已经有多个场景,需要选中希望复制的场景,去插入文件页面。 新增场景:插入的文件直接复制第一个场景的数字人和背景,其余视频素材效果不会被复制。同时包含文件的选中页面,生成对应的新场景。 如果插入文件之前,已经有多个场景,需要先选中希望的数字人及其背景的场景,再去插入文件页面。
0-4294967295 output_data_version String 输出数据的格式版本,如请求中无此参数,则输出数据格式为1.0,可选值有: 1.0: 对应的输出为: 动作数据:75个骨骼旋转值 表情数据:52ARkit表情及参数 2.0: 对应的输出为: 动作数据:55个骨骼旋转值+骨骼3D坐标
0-4294967295 output_data_version String 输出数据的格式版本,如请求中无此参数,则输出数据格式为1.0,可选值有: 1.0: 对应的输出为: 动作数据:75个骨骼旋转值 表情数据:52ARkit表情及参数 2.0: 对应的输出为: 动作数据:55个骨骼旋转值+骨骼3D坐标
RIAL时,包含MAIN、COVER和OTHER 资产类型为PPT时,包含MAIN、COVER、PAGE和OTHER 资产类型为HUMAN_MODEL时,包含MAIN、COVER、WHOLE_MODEL、USER_MODIFIED_MODEL和OTHER 资产类型为VOICE_M
单击“定制数字人”,跳转至形象制作页面,界面详情和操作指导,详见创建分身数字人定制任务。 数字人搜索框,可输入数字人名称进行精准搜索。 示例:云岚。 刷新图标。如果有关键词,按照关键词进行刷新展示;如果没有关键词,恢复为默认展示。 筛选条件 支持通过角色、性别、姿势、行业、区域和分辨率,筛选数字人。 数字人卡片
获取项目ID的接口为“GET https://{Endpoint}/v3/projects/”,其中{Endpoint}为IAM的终端节点可以从地区和终端节点获取。接口的认证鉴权请参见认证鉴权。 响应示例如下,其中projects下的“id”即为项目ID。 { "projects":
件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/advance-jobs
0-4294967295 output_data_version 否 String 输出数据的格式版本,如请求中无此参数,则输出数据格式为1.0,可选值有: 1.0: 对应的输出为: 动作数据:75个骨骼旋转值 表情数据:52ARkit表情及参数 2.0: 对应的输出为: 动作数据:55个骨骼旋转值+骨骼3D坐标
直播音频配置 relation_product 否 RelationProductInfo object 关联商品 表13 TextConfig 参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方
签能力是有差异的,请通过“查询资产详情”接口,获取每个音色支持使用的标签。 speak标签 描述 <speak></speak>:SSML文本的根节点。 语法 1 <speak>这里输入SSML标签的文本</speak> 属性 无 标签关系 <speak>可以包含文本和标签,包
"welcome_speech_id" : "af482f19fa934279831844ddeb13eaab", "welcome_speech" : "您好,有什么可以帮助您?", "enable_welcome_speech" : true, "robot_id" : "b3e2b1db1
可多个状态查询,使用英文逗号分隔。 如state=CREATING,PUBLISHED sort_key 否 String 排序字段,支持的排序方式有: 按创建时间排序:create_time 按更新时间排序:update_time 按资产排序:asset_order sort_dir 否
直播音频配置 relation_product 否 RelationProductInfo object 关联商品 表13 TextConfig 参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方
可多个状态查询,使用英文逗号分隔。 如state=CREATING,PUBLISHED sort_key 否 String 排序字段,支持的排序方式有: 按创建时间排序:create_time 按更新时间排序:update_time 按资产排序:asset_order sort_dir 否
文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物和鲜花,场地宽敞明亮,足够大家在室内共同交流和活动。 图1 文本驱动 文本内容的操作说明如表1所示。 不同声音对表1中操作的支持情况有差异。如果表1中操作项置灰,说明当前选择的声音不支持此操作。需要重新选择一
可多个状态查询,使用英文逗号分隔。 如state=CREATING,PUBLISHED sort_key 否 String 排序字段,支持的排序方式有: 按创建时间排序:create_time 按更新时间排序:update_time 按资产排序:asset_order sort_dir 否