检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
大小不超过20MB,时长不超过5分钟。 文本驱动 文本驱动方式的要求如下所示: 文本输入长度不超过2000字。 通过文本合成的音频时长不能超过5分钟。 在照片数字人制作页面,选择“文本驱动”方式驱动照片说话时,需要输入文本并选择音色,再单击“试听”预估音频时长。如果超过5分钟,会导致照片数字人制作失败。 父主题:
问题跟踪定位,建议使用uuId,若不携带,则后台自动生成 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String
问题跟踪定位,建议使用uuId,若不携带,则后台自动生成 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String
流程图示例中详细的接口交互说明,如下所示: 用户请求建立WebSocket连接 用户发送文本驱动消息 用户发送中断对话的消息 用户发送结束对话的消息 用户发送心跳请求消息 用户与数字人对话超时断连 会话任务结束 用户请求建立WebSocket连接 用户请求建立WebSocket连接时,会调用接口智能交互
第三方平台的直播画面突然中断是怎么回事? 可能是MetaStudio控制台自动退出登录导致。 排查和修改方法,如下所示: 在MetaStudio控制台直播间开播成功时,需要参考图1,单击URL地址右侧的拦截图标,从下拉框中选择允许弹出窗口。 图1 直播间开播 单击“完成”,会新增弹出如图2和图3所示的2个浏览器窗口。
调用API获取项目ID 从控制台获取项目ID 登录管理控制台。 鼠标悬停在右上角的用户名,选择下拉列表中“我的凭证”。 图1 管理控制台 在“API凭证”页面的项目列表中查看项目ID。 图2 获取项目ID 调用API获取项目ID 您还能通过调用查询指定条件下的项目信息API获取项目ID。 获取项目ID的接口为“GET
PUBLIC:公开,所有租户可访问。当前仅提供系统资产可公开访问。 SHARED:共享,指定租户可访问。拥有者指定租户可访问。 默认取值: 不涉及。 shared_state 否 String 参数解释: 共享状态。 约束限制: 该配置仅用于shared_type为SHARED的模板。
约束限制: 该配置仅用于模板 取值范围: PRIVATE:私有,仅本租户可访问。 PUBLIC:公开,所有租户可访问。当前仅提供系统资产可公开访问。 SHARED:共享,指定租户可访问。拥有者指定租户可访问。 默认取值: 不涉及。 shared_state String 参数解释:
使用文案样例(基础版)。 声音授权签署文件。 操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 图1 定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 选择
参数解释: PPT页面总数。 约束限制: 不涉及 取值范围: 0-256 默认取值: 0 pages Array of PPTPageInfo objects PPT页面图片。 表13 PPTPageInfo 参数 参数类型 描述 page_no Integer 参数解释: 页面编号。 约束限制:
约束限制: 该配置仅用于模板 取值范围: PRIVATE:私有,仅本租户可访问。 PUBLIC:公开,所有租户可访问。当前仅提供系统资产可公开访问。 SHARED:共享,指定租户可访问。拥有者指定租户可访问。 默认取值: 不涉及。 shared_state 否 String 参数解释:
单击“生成预览”,选择“当前场景”或者“所有场景”,生成预览视频,可预览视频生成后的效果。 图标 单击图标,放大展示“文本驱动”页签,提升用户操作体验。 单击“确定”,可关闭页面。 图标 调整视频播报的音量。 图标 单击图标可开启字幕展示,并可在画布左侧设置字幕的字体、大小和位置等。 “音频驱动”方式目前仅支持中文普通话的场景开启字幕。
格式为(YYYYMMDD'T'HHMMSS'Z')。 X-User-Privilege 否 String 用户白名单权限。用于控制用户的访问权限 X-App-UserId 否 String 第三方用户ID。不允许输入中文。 响应参数 状态码: 200 表3 响应Header参数 参数 参数类型
格式为(YYYYMMDD'T'HHMMSS'Z')。 X-User-Privilege 否 String 用户白名单权限。用于控制用户的访问权限 X-App-UserId 否 String 第三方用户ID。不允许输入中文。 响应参数 状态码: 200 表3 响应Header参数 参数 参数类型
参数解释: PPT页面总数。 约束限制: 不涉及 取值范围: 0-256 默认取值: 0 pages Array of PPTPageInfo objects PPT页面图片。 表15 PPTPageInfo 参数 参数类型 描述 page_no Integer 参数解释: 页面编号。 约束限制:
格式为(YYYYMMDD'T'HHMMSS'Z')。 X-User-Privilege 否 String 用户白名单权限。用于控制用户的访问权限 X-App-UserId 否 String 第三方用户ID。不允许输入中文。 响应参数 状态码: 200 表4 响应Header参数
String 使用AK/SK方式认证时必选,携带项目ID信息。 X-User-Privilege 否 String 用户白名单权限。用于控制用户的访问权限 X-App-UserId 否 String 第三方用户ID。不允许输入中文。 响应参数 状态码: 200 表3 响应Header参数
如何实时切换智能交互的语言和声音? 在展厅等智能交互场景中,会有切换智能交互界面,数字人说话语言和声音的需求。 请参考下述步骤操作: 登录MetaStudio控制台。 如果是展厅场景,需要切换到“华北-北京四”区域。因为展厅的配置,均在“华北-北京四”区域。 在左侧导航栏中,选择“我的创作”。
格式为(YYYYMMDD'T'HHMMSS'Z')。 X-App-UserId 否 String 第三方用户ID。不允许输入中文。 X-User-Privilege 否 String 用户白名单权限。用于控制用户的访问权限 响应参数 状态码: 200 表3 响应Header参数 参数 参数类型 描述 X-Request-Id
X-App-UserId 否 String 第三方用户ID。不允许输入中文。 X-User-Privilege 否 String 用户白名单权限。用于控制用户的访问权限 表3 请求Body参数 参数 是否必选 参数类型 描述 state 是 String 参数解释: 文件上传状态。 约束限制: 不涉及