检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
0/OS-USER/users 图1 URI示意图 为方便查看,在每个具体API的URI部分,只给出resource-path部分,并将请求方法写在一起。这是因为URI-scheme都是HTTPS,而Endpoint在同一个区域也相同,所以简洁起见将这两部分省略。 请求方法 HTT
打开简易录音机软件,单击底部的“播放”菜单,进入“播放”页面。 单击界面右上方的“编辑”,进入音频文件编辑页面。 选中所有的音频文件,单击“分享”,可选择隔空投送或其他第三方应用导出音频文件至PC中。 一个长音频文件无需压缩,可直接上传至MetaStudio控制台,进行声音训练。 安卓手机 安卓手机推荐下载软件“超级录音机”进行录音,如图2所示。
String 参数解释: 操作。 约束限制: 系统属性仅为系统设置,普通用户无法修改。 取值范围: ADD:增加 DELETE:删除 默认取值: 不涉及 key 否 String 参数解释: 系统属性条目。 约束限制: 系统属性仅为系统设置,普通用户无法修改。 取值范围: 公共资产属性:
系统资产标签定义 查询资产列表接口支持使用“tags”标签对分身数字人模型进行分类。 “tags”取值及其含义,如表1所示。 表1 tags标签说明 tags取值类型 说明 数字人类型 取值如下: VIRTUAL_AVATARS:分身数字人 VIRTUAL_HUMANS:虚拟数字人
String 参数解释: 操作。 约束限制: 系统属性仅为系统设置,普通用户无法修改。 取值范围: ADD:增加 DELETE:删除 默认取值: 不涉及 key String 参数解释: 系统属性条目。 约束限制: 系统属性仅为系统设置,普通用户无法修改。 取值范围: 公共资产属性:
String 参数解释: 操作。 约束限制: 系统属性仅为系统设置,普通用户无法修改。 取值范围: ADD:增加 DELETE:删除 默认取值: 不涉及 key 否 String 参数解释: 系统属性条目。 约束限制: 系统属性仅为系统设置,普通用户无法修改。 取值范围: 公共资产属性:
dio服务,会提前3个月在现网开放下线公告。 视频直播限制,如视频直播限制所示。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”。 进入分身数字人直播首页面,如图1所示。 图1 分身视频直播首页面 在“直播管理”页签,单击“创建直播间”,进入视频直播制作界面。
格式为(YYYYMMDD'T'HHMMSS'Z')。 X-Project-Id 否 String 使用AK/SK方式认证时必选,携带项目ID信息。 X-App-UserId 否 String 第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 command
String 参数解释: 操作。 约束限制: 系统属性仅为系统设置,普通用户无法修改。 取值范围: ADD:增加 DELETE:删除 默认取值: 不涉及 key String 参数解释: 系统属性条目。 约束限制: 系统属性仅为系统设置,普通用户无法修改。 取值范围: 公共资产属性:
如果用户在第三方直播平台的直播画面没有声音,需排查是否是OBS工具设置的桌面音频设备与Windows系统的声音输出设备不一致导致。 检查方法如下所示: 检查OBS桌面音频设备 检查Windows系统的声音输出设备 检查OBS桌面音频设备 本地打开OBS视频采集工具。 在界面下方,选择“混音器”。
交互配置的大模型机器人ID。 获取方法请参考创建应用。 取值范围: 字符长度0-64位。 默认取值: 不涉及 play_type 否 String 回复播放类型。 APPEND:追加,放置在场景播放队列尾部 INSERT: 插入,在两个音频文件,或者文本句末添加。 PLAY_NOW
能交互配置的大模型机器人ID。 获取方法请参考创建应用。 取值范围: 字符长度0-64位。 默认取值: 不涉及 play_type String 回复播放类型。 APPEND:追加,放置在场景播放队列尾部 INSERT: 插入,在两个音频文件,或者文本句末添加。 PLAY_NOW
使用本接口前,需要在MetaStudio控制台服务概览页面,开通“声音合成”的按需计费。 详细操作为:单击“声音合成”卡片中的“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。开通后的效果如图1所示。 如需使用第三方声音进行语音合成,请购买出门问问声音套餐。
查询音色ID 支持在MetaStudio控制台或通过API接口查询音色ID,详情如下所示: 在控制台查询音色ID(方式一):仅支持查询自定义音色ID。 在控制台查询音色ID(方式二):支持查询全量音色ID。 使用接口查询音色ID:支持查询全量音色ID。 在控制台查询音色ID(方式一)
默认取值: 0 limit 否 Integer 每页显示的条目数量。 取值范围: 1-100 默认取值: 10 robot_id 是 String 应用ID。 language 否 String 智能交互语言 CN:中文 EN:英文 请求参数 表3 请求Header参数 参数 是否必选 参数类型
交互配置的大模型机器人ID。 获取方法请参考创建应用。 取值范围: 字符长度0-64位。 默认取值: 不涉及 play_type 否 String 回复播放类型。 APPEND:追加,放置在场景播放队列尾部 INSERT: 插入,在两个音频文件,或者文本句末添加。 PLAY_NOW
c11bd9f36bc22ced3a7a/test.mp3?AccessKeyId=dnhlruEz0ZPD8Y8wnodo&Signature=E94GDa%2Bt3L%2F9mTnNXpFfGGFEe7c%3D", "frame_rate" : 60 } 响应示例 状态码:
默认取值: 0 limit 否 Integer 每页显示的条目数量。 取值范围: 1-100 默认取值: 10 robot_id 是 String 应用ID。 language 否 String 智能交互语言 CN:中文 EN:英文 pacify_words_type 否 Integer 安抚话术类型
使用AK/SK方式认证时必选,携带项目ID信息。 X-App-UserId 否 String 第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 robot_id 是 String 应用ID。 welcome_speech 是 String 欢迎词。
默认取值: 0 limit 否 Integer 每页显示的条目数量。 取值范围: 1-100 默认取值: 10 robot_id 是 String 应用ID。 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。