检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
是 Integer 参数解释: 图层左上角像素点的X轴位置值(画布左上角坐标是0x0)。 横屏(16:9)画布像素为1920x1080;竖屏(9:16)画布像素为1080x1920。 约束限制: 该值为相对于画布的像素值,仅表示布局位置关系,与输出画面分辨率无关。 取值范围: -1920-3840
分身数字人X轴位置,即分身数字图片底边中心点像素的X轴的像素值。 横屏(16:9)背景图片像素为1920x1080;竖屏(9:16)背景图片像素为1080x1920。 取值范围: -1920-3840 position_y 否 Integer 分身数字Y轴位置,即分身数字图片底边中心点像素的Y轴的像素值。 横屏(16
在服务主界面,单击左侧导航栏中的“任务中心”。 查看“分身数字人”页签的数字人定制任务列表,找到被驳回的数字人定制任务。 任务状态为“审核未通过”。 单击任务右侧的“查看原因”,在弹出的“审核未通过”对话框中,查看审核未通过的原因。 按照规范重新录制或提供符合规范的视频。 单击任务右侧的“重新上传”,上传更新后的视频。
大家好,今天我很高兴能来到这里进行数字人形象和声音的采集。接下来,我将和大家一起复盘一下数字人的形象拍摄要求。 第一步,我们需要在拍摄前检查自己的穿着,在绿幕的拍摄环境下,不能穿绿色或者透明的衣服、也不要穿含有密集条纹的衣服。我们需要确保面部没有零散的发丝,尽量不要佩戴眼镜或者项链、耳环、手
dx Integer 参数解释: 图层左上角像素点的X轴位置值(画布左上角坐标是0x0)。 横屏(16:9)画布像素为1920x1080;竖屏(9:16)画布像素为1080x1920。 约束限制: 该值为相对于画布的像素值,仅表示布局位置关系,与输出画面分辨率无关。 取值范围: -1920-3840
分身数字人X轴位置,即分身数字图片底边中心点像素的X轴的像素值。 横屏(16:9)背景图片像素为1920x1080;竖屏(9:16)背景图片像素为1080x1920。 取值范围: -1920-3840 position_y 否 Integer 分身数字Y轴位置,即分身数字图片底边中心点像素的Y轴的像素值。 横屏(16
仅支持数字人平台配置或内置ASR(语音转文本)能力的方案。不支持WebSocket接口驱动数字人方案,即文本驱动方案。 在调用create接口之前,必须要有用户点击集成WebSDK的页面的行为。 浏览器通过有上述点击的行为,才能获取采集声音的权限。否则无法采集声音,无法正常使用语音唤醒能力。
购买出门问问声音套餐, 详见购买出门问问语音合成套餐的操作流程。 购买出门问问语音合成套餐的操作流程 如需使用系统预置的第三方声音,需要购买出门问问语音合成套餐包,详细的操作流程如下所示。第三方声音支持的语言类型,如第三方声音支持的语言类型所示。 购买出门问问语音合成套餐包:在云商
HumanPosition2D object 分身数字人在背景图片的位置设置。不设置默认在图片中间。 说明: 此参数废弃。分身数字人在背景中位置在layer_config参数中配置。 human_size_2d HumanSize2D object 分身数字人在背景图片的大小设置。 说明: 此参数废弃。分身数
参数解释: 字体。当前支持的字体请参考服务支持的字体 约束限制: 不涉及。 取值范围: 字符长度0-64位 默认取值: HarmonyOS_Sans_SC_Black font_size Integer 参数解释: 字体大小。接口的取值范围为0-120,实际业务使用的取值范围要求为24-120,请以业务实际使用要求为准。
请选择输出模型语言 选择输出的声音模型支持的语言。 支持如下语言: 多语种:输出的声音模型,支持合成的语言类型包括中文、英文、德语、法语、土耳其语、菲律宾语、日语、意大利语、马来语、俄罗斯语、韩语、芬兰语、西班牙语、印尼语、阿拉伯语、葡萄牙语、荷兰语。 粤语 选择声音标签 声音的标签。作用为选择声音时,快速筛选领域。
支持通过视频来源的维度,筛选展示下方的视频。 视频列表 默认展示全量视频。 查看视频 将鼠标放在视频上方,视频右上角展示图标。单击图标,可查看视频。 插入视频 将鼠标放在视频上方,视频右上角展示图标。单击图标,添加至当前场景的视频直播画面中。 插入的视频播放的时候默认无声音,仅有画面。 在视频直播画面预览区域,如
单独上传语料包:单独录制音频文件,需要单击下方的“点击上传音频文件”,上传音频。 音频格式支持WAV、MP3,单段音频时长1~5分钟,建议1分钟。语料中的语言仅支持中文和英文。 视频中提取声音:直接提取训练视频中的声音,训练生成Flexus声音。 视频中的语言仅支持中文和英文。 须知:“单独上传语料包”的方式生成Flexus声音的效果会更好。
用户也可以使用批量导入的方式,一次性添加完成问题类别及其所有问答对。操作方式如下所示: 在左侧导航栏中,选择“知识库 > 问答管理”。 单击界面右侧的“导入”,弹出“导入训练语料”对话框。 图7 导入训练语料 单击“下载模板”,将语料模板下载至本地。 请按照模板文件的格式,填充完成所有问题分类及其全量语料对,保存文件。
分身数字人X轴位置,即分身数字图片底边中心点像素的X轴的像素值。 横屏(16:9)背景图片像素为1920x1080;竖屏(9:16)背景图片像素为1080x1920。 取值范围: -1920-3840 position_y 否 Integer 分身数字Y轴位置,即分身数字图片底边中心点像素的Y轴的像素值。 横屏(16
参数解释: 字体。当前支持的字体请参考服务支持的字体 约束限制: 不涉及。 取值范围: 字符长度0-64位 默认取值: HarmonyOS_Sans_SC_Black font_size 否 Integer 参数解释: 字体大小。接口的取值范围为0-120,实际业务使用的取值范围要求为24-120,请以业务实际使用要求为准。
Language)标记语言。 需要使用的标签,如下所示: <speak>:此标签为所有文本的根节点。一切需要调用SSML标签的文本,都要包含在<speak> </speak>标记对中。 <emotion>:情感标签,对指定的一或多句话生效。标签开始在句子起始位置,标签结束在句子结尾。用法为:<emotion
持设置大小,拖动位置。 删除文件 直接单击文件右下角的图标,执行下述操作: 从下拉框中选择“删除”,删除当前文件。 从下拉框中选择“批量删除”,勾选所有需要删除的文件。单击界面右下角的“删除”,删除选中的所有文件。 文件上传成功后的操作如下所示: 在PPT页签的文件列表区域,单击
在我的凭证下,您可以查看账号ID和用户ID。通常在调用API的鉴权过程中,您需要用到账号、用户和密码等信息。 区域 指云资源所在的物理位置,同一区域内可用区间内网互通,不同区域间内网不互通。通过在不同地区创建云资源,可以将应用程序设计的更接近特定客户的要求,或满足不同地区的法律或其他要求。 可用区 一个可用
参数解释: 字体。当前支持的字体请参考服务支持的字体 约束限制: 不涉及。 取值范围: 字符长度0-64位 默认取值: HarmonyOS_Sans_SC_Black font_size 否 Integer 参数解释: 字体大小。接口的取值范围为0-120,实际业务使用的取值范围要求为24-120,请以业务实际使用要求为准。