检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
声音更新记录 2024年12月 表1 声音更新记录 发音人名称 性别 TTS版本 风格 语言 对话女生 女 TTS V7 - 中文 广告男声 男 TTS V7 - 中文 教育女声 女 TTS V7 - 中文 客服男声 男 TTS V7 - 中文 客服女声 女 TTS V7 - 中文
剧本名称。 约束限制: 不涉及。 取值范围: 只能使用中英文字符,字符长度1-256位。 默认取值: 不涉及。 script_description 否 String 参数解释: 剧本描述。 约束限制: 不涉及。 取值范围: 字符长度0-1024位。 默认取值: 不涉及。 view_mode
更新商品 功能介绍 Update product 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/products/{product_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。
默认取值: 不涉及。 rule_name String 参数解释: 规则名称。 约束限制: 不涉及。 取值范围: 字符0-256位 默认取值: 不涉及。 enabled Boolean 参数解释: 是否启用。 约束限制: 不涉及。 取值范围: true:启用 fasle:不启用 默认取值:
Integer 参数解释: 字幕框左下角像素点坐标。 约束限制: 不涉及。 默认取值: 不涉及。 取值范围: 0-1920 dy 否 Integer 参数解释: 字幕框左下角像素点坐标。 约束限制: 不涉及。 默认取值: 不涉及。 取值范围: 0-1920 font_name 否 String
默认取值: 不涉及。 rule_name String 参数解释: 规则名称。 约束限制: 不涉及。 取值范围: 字符0-256位 默认取值: 不涉及。 enabled Boolean 参数解释: 是否启用。 约束限制: 不涉及。 取值范围: true:启用 fasle:不启用 默认取值:
约束限制: 不涉及。 取值范围: 只能使用中英文字符,字符长度0-256位。 默认取值: 不涉及。 asset_description 否 String 参数解释: 资产描述。 约束限制: 不涉及。 取值范围: 只能使用中英文字符,字符长度0-4096位。 默认取值: 不涉及。 asset_type
更新第三方直播平台信息 功能介绍 该接口用于更新第三方直播平台信息。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/live-platforms/platforms/{platform_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
修改说明 2025-01-14 本次变更如下: 新增发布3.0.2版本SDK,相比3.0.1版本,变更点如下所示: 语音唤醒能力支持设备切换实时生效。 2024-12-30 本次变更如下: 新增发布3.0.1版本SDK,相比2.2.0版本,变更点如下所示: 新增语音唤醒能力,详见Web语音唤醒。
更新数字人名片制作 功能介绍 该接口用于更新数字人名片制作任务。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/digital-human-business-cards/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
配置特殊词表 支持全局设置多音字或者别名,设置完成后,所有视频草稿自动生效。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“声音”页签,单击界面右侧的“特殊词表”,进入如图1所示的界面。 图1 特殊词表 单击“新建词表”,界面新增一行特殊词,如图2所示。
购买的语音合成套餐用户凭证,如图16所示。 用户凭证的查询方式,如获取第三方声音使用凭证所示。 图16 更新凭证 单击“确认修改”,界面提示“修改成功”。 修改成功后,自动生效,无需重新激活第三方声音。 父主题: 购买声音套餐
更新分身数字人模型训练任务 功能介绍 该接口用于更新分身数字人模型训练任务。用于在自动审核或者人工审核不通过情况下,更新训练视频、身份证照片等。 该接口只能在AUTO_VERIFY_FAILED或者MANUAL_VERIFY_FAILED状态下调用 调用方法 请参见如何调用API。
单击“保存文档”。等待文档名称右侧的状态,从“解析中”变为“已解析未发布”,如图7所示。 图7 保存文档 单击界面右上方的“构建发布”。发布成功后,文档名称右侧的状态更新为“发布成功”,如图8所示。 图8 构建发布 配置应用 在界面上方的主菜单中,单击“我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。
Web语音唤醒 产品预置了唤醒能力,详见预制唤醒能力,如果用户需要更新唤醒词,需要参考定制唤醒能力处理。唤醒模型定制完成后,产品会提供给用户,用户需要参考更新唤醒模型,将模型更新至本地模型路径中。 使用要求 WebSDK版本为3.0.1及以上。 仅支持数字人平台配置或内置ASR(
须知: 这里设置的多音字,仅对当前视频草稿有效,如需全局生效,可参考配置特殊词表配置。 别名 选中需要通过别名播报的文本内容 ,单击“别名”,设置为实际播报的内容。 须知: 这里设置的别名,仅对当前视频草稿有效,如需全局生效,可参考配置特殊词表配置。 数字英文 示例数字“1024”的读法如下所示:
约束限制: 不涉及。 取值范围: IMAGE:图片背景,指定图片用作分身数字人背景。 COLOR:纯色背景,指定颜色RGB值作为分身数字人背景。 默认取值: 不涉及 background_title String 参数解释: 背景标题。 约束限制: 分身数字人视频制作此参数不生效。 取值范围:
SDK的接口详情。 表1 接口 接口 描述 三方驱动场景(是否支持) 非三方驱动场景(是否支持) activeInteractionMode 获取当前生效的交互模式(语音问答/文本问答)。 × √ addEventListeners 回调注册。 √ √ checkBrowserSupport
Integer 参数解释: 字幕框左下角像素点坐标。 约束限制: 不涉及。 默认取值: 不涉及。 取值范围: 0-1920 dy Integer 参数解释: 字幕框左下角像素点坐标。 约束限制: 不涉及。 默认取值: 不涉及。 取值范围: 0-1920 font_name String
Integer 参数解释: 字幕框左下角像素点坐标。 约束限制: 不涉及。 默认取值: 不涉及。 取值范围: 0-1920 dy Integer 参数解释: 字幕框左下角像素点坐标。 约束限制: 不涉及。 默认取值: 不涉及。 取值范围: 0-1920 font_name String