检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
分身数字人视频制作支持开通或关闭按需计费。 分身数字人视频直播 左下角展示用户当前剩余可用的视频直播路数,即用户还可以并发开启的视频直播数量。 分身数字人视频直播支持开通或关闭按需计费。 分身数字人智能交互 左下角展示用户当前剩余可用的智能交互路数,即用户还可以并发开启的数字人交互对话数量。
取值如下所示: APPEND:在播放队列的尾部追加播放。 INSERT:在两个音频文件中间插入播放,或在当前正播放文本的句末插入播放。 PLAY_NOW:收到指令后,立即插入播放。无需等待当前文本播放至句末。 默认值:PLAY_NOW。 取值最小长度0,最大长度32。 play_role
在控制台查询音色ID(方式二):支持查询全量音色ID。 使用接口查询音色ID(方式三):支持查询全量音色ID。 在控制台查询音色ID(方式一) 当前方式仅支持查询用户自定义音色ID,不支持查询系统预置音色ID。 登录MetaStudio控制台。 在左侧导航栏中,选择“我的创作”。 选择“资源”页签,单击“声音”页签。
udio控制台查看已分配的资源列表,正常使用MetaStudio服务并消耗相应的资源。 前提条件 SP用户已关联当前租户,操作请参考关联租户。 SP用户已分配资源给当前租户,操作请参考分配资源。 操作步骤 租户登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线
转移资产 当前租户支持转移声音和分身模型资产给其他租户。声音和分身模型资产的转移操作均相同,下面以分身模型资产为例进行操作演示。 前提条件 如果当前租户希望转移资产给其他租户,需要提交工单或联系大客户经理,并提供已获取的项目ID,申请加入白名单。 租户所在Region的项目ID获取方法,请参见获取项目ID。
路数就是并发数,是视频直播同时执行的任务数量。需要几路并发,就买几路。如果已开通按需计费,当并发任务数超出已购买路数时,超出的路数自动走按需结算,费用从当前账户余额中扣除。 按需计费 包年/包月 分身数字人智能交互 支持购买多路,每路按时长计费。 须知: 智能交互中数字人分身的动作是根据数字分
SSML基础定义可参考语音合成标记语言版本 1.0。MetaStudio在此基础上,扩展了一些字段用于实现数字人的控制。 MetaStudio SSML当前支持如下能力: TTS语音合成时,控制文字读音。 包含如下标签: <speak></speak>标签为SSML文本根节点。 <break/>标签用于静音停顿,可设置停顿时长。
不涉及 取值范围: 当前仅支持一条RTMP出流地址。 默认取值: 不涉及。 backup_model_asset_ids Array of strings 参数解释: 主播轮换时备选主播数字人资产ID(仅形象资产,不包含声音)。 约束限制: 不涉及 取值范围: 当前最大支持5个备选主播。
不涉及 取值范围: 当前仅支持一条RTMP出流地址。 默认取值: 不涉及。 backup_model_asset_ids 否 Array of strings 参数解释: 主播轮换时备选主播数字人资产ID(仅形象资产,不包含声音)。 约束限制: 不涉及 取值范围: 当前最大支持5个备选主播。
不涉及 取值范围: 当前仅支持一条RTMP出流地址。 默认取值: 不涉及。 backup_model_asset_ids 否 Array of strings 参数解释: 主播轮换时备选主播数字人资产ID(仅形象资产,不包含声音)。 约束限制: 不涉及 取值范围: 当前最大支持5个备选主播。
String 按数字人形象ID查询。 model_name 否 String 按形象名称模糊查询。 live_state 否 String 当前直播间直播状态。 WAITING,PROCESSING,SUCCESS,FAILED,CANCELED对应直播任务状态 NULL 对应没有直播任务
RTMP视频推流第三方直播平台地址。 说明: 直播过程中刷新地址,需要调用COMMAND命令REFRESH_OUTPUT_URL。 约束限制: 不涉及 取值范围: 当前仅支持一条RTMP出流地址。 默认取值: 不涉及。 stream_keys 否 Array of strings 参数解释: RTMP视频
"Yes"}] 界面展示效果,如图5所示。 图5 素材视频 形象制作、声音制作、视频制作的音频驱动,不属于资产库管理范畴(详见资产范围说明),不适用于当前上传资产示例章节。 父主题: 应用示例
tudio制作的模型,仅支持在本服务内使用。 数字人不支持换脸、换衣服。 如果形象训练视频包含动作编排,那么生成的数字人卡片会有标识,说明当前数字人支持添加动作。 Flexus分身数字人 分身数字人Flexus版针对中小企业客户,提供1080P的实景数字人、1分钟语料声音克隆能力
表页面,如图所示。 图3 任务列表 单击任务所在行的“查看详情”,进入“定制任务详情”页面,如图4所示。 查看分身数字人定制任务审核进展,当前状态为“系统审核中”。数字人定制任务提交成功后,会在1个工作日内完成审核。 图4 定制任务详情 审核通过后,任务状态变更为“算法训练中”,如图所示。
获取TTS试听文件 功能介绍 该接口用于获取TTS试听文件下载链接,返回List中包含当前已生产的试听文件。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/ttsc/audition-file/{job_id} 表1 路径参数 参数 是否必选
用于生成WHOLE_MODEL的模型file_id 约束限制: 如果当前记录的信息与MAIN文件的file_id一致,那就认为已经生成过,无需再进行全模型导出 取值范围: 字符长度0-64位。 默认取值: 不涉及。 load_model_file_id 否 String 参数解释: 当前用于渲染加载的模型file_id
相对于内容的开始时间。 约束限制: 预留字段。当前只需要填sequence_no即可。 默认取值: 不涉及。 取值范围: 0-2592000 end_time Float 参数解释: 结束时间。 单位秒。 相对于内容的结束时间。 约束限制: 预留字段。当前只需要填sequence_no即可。
取值范围: 40-30000 width 是 Integer 参数解释: 视频宽度。单位:像素。 约束限制: clip_mode=RESIZE时,当前支持1920x1080、1080x1920、1280x720、720x1280、3840x2160、2160x3840六种分辨率。4K分辨
用于生成WHOLE_MODEL的模型file_id 约束限制: 如果当前记录的信息与MAIN文件的file_id一致,那就认为已经生成过,无需再进行全模型导出 取值范围: 字符长度0-64位。 默认取值: 不涉及。 load_model_file_id String 参数解释: 当前用于渲染加载的模型file_id