检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数字人支持添加动作吗? 需要数字人模型训练时使用的形象采集视频包含动作编排,才可以添加动作,详见动作编排定制采集指南。 目前仅视频制作支持数字人插入动作,如图1所示。在数字人卡片上有标识,说明当前数字人支持添加动作。 添加动作时需要注意,动作生效需要有足够的音频时间,如果音频太短,数字人可能来不及做动作。
表情驱动数据格式如何定义? MetaStudio表情驱动的表情基数据总共52个系数,每个系数的取值范围在0~1之间,表情基系数的顺序性定义如下: 序号 表情名称 0 mouthPucker 1 mouthPressLeft 2 mouthPressRight 3 mouthRollUpper
Flexus支持通过API集成使用吗? 支持,详见接口创建分身数字人模型训练任务的is_flexus字段。 父主题: API和SDK使用
配置特殊词表 支持全局设置自定义读法,设置完成后,所有视频制作剧本自动生效。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“声音”页签,单击界面右侧的“特殊词表”,进入如图1所示的界面。 图1 特殊词表 单击“新建词表”,界面新增一行自定义读法,如图2所示。
每个单场景上传音频的大小不超过100M。 视频格式 插入的视频素材支持的格式为:MP4、M4V、MKV、MOV、FLV、3GP、WMV、AVI和WEBM。 说明: 在视频制作界面,如果添加视频,且视频格式为FLV、3GP、WMV、AVI时,无法展示视频播放效果,仅能图片展示。这是浏览器不兼容导致的,但是不影响视
获取语音驱动表情数据 功能介绍 该接口用于获取生成的数字人表情驱动数据 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/fas-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户项目ID
AH0">weather</phoneme> is very good. 属性 表2 属性说明 属性名称 属性类型 属性值 是否必选 描述 ph String 拼音或音素 是 输入汉语拼音时,声调用1、2、3、4来表示,5表示轻声。 CMU词典音素。 举例1:天气的ph取值为“tian1 qi4”。
服务支持的字体 MetaStudio制作视频添加的字幕,视频画面中的文本信息都涉及字体。目前MetaStudio服务支持的字体及语言类型如表1所示。 表1 服务支持的字体说明 字体名称 支持的语言类型 Adelle_Sans_Global Adelle_Sans_Global_Bold
查询知识库意图列表 功能介绍 该接口用于查询知识库意图列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/knowledge/intent 表1 路径参数 参数 是否必选 参数类型 描述 project_id
每个单场景上传音频的时长需大于1分钟,大小不超过100M。 视频格式 视频支持的格式为:MP4、M4V、MKV、MOV、FLV、3GP、WMV和AVI。 说明: 在直播间制作界面,如果添加视频,且视频格式为FLV、3GP、WMV、AVI时,无法展示视频播放效果,仅能图片展示。这是浏览器不兼容导致的,但是不影响直播效
部分浏览器提交H265训练视频失败如何处理? 问题描述 制作分身形象时,上传的训练视频无法播放,或提交训练任务时,提示分辨率不符合要求,如下图所示。 图1 分身形象制作 问题原因 由于Chrome等浏览器只支持硬解码H265(HEVC)视频,当您的PC硬件不支持解码H265(HE
字符长度0-1024 默认取值: 不涉及。 表10 TriggerProcess 参数 参数类型 描述 time_window Integer 参数解释: 处理抑制时长。单位秒。 -1:表示整场直播仅触发一次。 0:表示无抑制,每次都触发。 其他值n:表示n秒内仅触发一次。 约束限制: 不涉及
Id。 × √ error 【事件说明】 在业务异常时,返回的错误事件。 【回调参数】 icsError:IcsError类型。字段定义如表2所示。 表2 IcsError 参数 类型 描述 code string 错误码。详情请参见错误码(ICSError)。 message string
查询知识库技能列表 功能介绍 该接口用于查询知识库技能列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/knowledge/skill 表1 路径参数 参数 是否必选 参数类型 描述 project_id
、M4V、MKV、FLV、3GP、WMV和AVI格式的视频文件。支持添加为背景视频。 商品:商品列表。需要自定义创建商品,一个商品可以同时包含贴图、视频、文本和音频内容。 文本:文本模板列表,可选择一个文本模板,在视频直播画面上添加文本。 ② 直播画面预览窗口,用于预览视频直播静态画面效果。
视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体,示例如表1所示。以奇妙问知识库为例,可以通过新增知识库来补充富媒体知识。 如果使用服务提供SDK默认样式,受限于浏览器的CSP策略,导入图片、视频链接的域名,需提交工单添加至白名单。 表1 问答知识库 序号 标准问题 问题答案 1 如何领券?
查询知识库问法列表 功能介绍 该接口用于查询知识库问法列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/knowledge/question 表1 路径参数 参数 是否必选 参数类型 描述 project_id
图6 视频界面 视频界面说明,如表5所示。 表5 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择MOV、MP4、M4V、MKV、FLV、3GP、WMV、AVI或WEBM格式的视频文件上传。 也支持直接拖拽本地视频文件至视频列表区域,完成上传操作。 界面默认展
图4 视频界面 视频界面说明,如表4所示。 表4 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择MOV、MP4、M4V、MKV、FLV、3GP、WMV或AVI格式的视频文件上传。 也支持直接拖拽本地视频文件至视频列表区域,完成上传操作。 界面默认展示两列
式返回。后一条通知中的text字段值包含前一条通知的内容。例如:第一条通知的text值为“你吃”,第二条新识别了“饭了么”,则第二条text值为“你吃饭了么”。 semanticRecognized的流式返回是分段式返回。后一条通知中的text字段值与前一条通知的内容是上下衔接关