检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
获取账号ID 在调用接口的时候,部分URL中需要填入账号ID,所以需要先在管理控制台上获取到账号ID。具体获取步骤如下: 登录管理控制台。 鼠标悬停在右上角的用户名,选择下拉列表中“我的凭证”。 在“API凭证”页面,即可获取对应的账号ID信息。 图1 获取账号ID 父主题: 附录
创建资产 功能介绍 该接口用于在资产库中添加上传新的媒体资产。可上传的资产类型包括:分身数字人模型、背景图片、素材图片、素材视频、PPT等。 资产类型是IMAGE时,通过system_properties来区分背景图片(BACKGROUND_IMG)、素材图片(MATERIAL_IMG)。
标准版数字人可以用实景拍摄吗? 可以,详见拍摄真人视频中的“实景数字人拍摄要求”。 使用实景拍摄,不支持抠图和更换背景,后期使用数字人会一直带着拍摄的背景。只有绿幕素材后续可以更换背景,蓝幕也不支持更换背景。 父主题: 声音和形象制作
口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/middle-jobs
口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/basic-jobs
直播控制HTTP Command命令说明 分身数字人直播过程中,支持通过HTTP API的方式人工接管直播。人工接管以后,支持通过下述方式驱动数字人说话: 文本驱动方式:对应Command命令为“INSERT_PLAY_SCRIPT”,即插入表演脚本,用于互动回复。数字人不变时,
登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“视频”页签,如图1所示。 在“视频”页面,可以看到已生成的视频列表,以卡片形式排列展示。 支持对视频进行如下操作: 单击播放图标,播放照片数字人视频。 单击,在弹出的下拉框中,可下载视频至本地、查看详情、重命名或删除视频。
参考OBS的PUT上传接口,上传资产文件至2中返回的upload_url(文件上传地址,有效期为24小时)中,如图3所示。 详细操作说明,如下所示: 在Postman工具中,将upload_url地址作为请求地址,使用PUT方式上传。 Params:已包含在upload_url地址中,已携带鉴权信息,无需更改。
合成视频二次剪辑后,数字人口型效果变差? 需要检查二次剪辑软件的视频帧率。因为数字人合成视频的帧率为25,如果用户使用软件的帧率为30,需要插帧至数字人视频中,才能达到30,这样就导致插帧后的口型对不上了。所以用户对视频进行二次剪辑时,帧率必须设置为25的整数倍,才不会影响数字人的口型效果。 父主题:
视频制作界面如图1所示。各区域详细说明,如表1所示。 用户使用数字人形象创作的视频,都会自动保存在MetaStudio控制台首页“最近项目”区域的“视频项目”页签中。用户可以根据实际情况,进行二次创作。 图1 视频制作界面 表1 界面说明 序号 区域名称 说明 1 视频素材区域 设置视频的场景,包括如下
在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 您可以在API Explorer中,具体API页面的“代码示例”页签查看对应编程语言类型的SDK代码,如图1 获取SDK代码示例所示。 图1 获取SDK代码示例 SDK列表
获取项目ID 在调用接口的时候,部分URL中需要填入项目ID,所以需要获取到项目ID。您可以通过以下两种方式获取项目ID。 从控制台获取项目ID 调用API获取项目ID 从控制台获取项目ID 登录管理控制台。 鼠标悬停在右上角的用户名,选择下拉列表中“我的凭证”。 图1 管理控制台 在
产品预置了唤醒能力,详见预制唤醒能力,如果用户需要更新唤醒词,需要参考定制唤醒能力处理。唤醒模型定制完成后,产品会提供给用户,用户需要参考更新唤醒模型,将模型更新至本地模型路径中。 使用要求 WebSDK版本为3.0.1及以上。 仅支持数字人平台配置或内置ASR(语音转文本)能力的方案。不支持WebSocket接口驱动数字人方案,即文本驱动方案。
Integer 生成文本在列表中的索引值,从0开始计算。 表8 MessageItem 参数 是否必选 参数类型 描述 content 是 String 对话内容。 取值最小长度1,最大长度4096。 请求参数“is_stream”取值为“true”时,响应Body体中的参数说明,如表6所示。
如果已开通按需,需检查直播并发路数是否超出套餐。 如果已开通按需,且直播并发路数超出套餐,那么超出套餐的路数自动走按需结算,费用从当前账户余额中扣除结算费用。 须知:按需计费开通后,目前不支持关闭,请谨慎确认后再开通使用。 父主题: 计费咨询
租户在“我的资源”区域,可以看到资源剩余量详情,如表1所示。也可以单击左侧导航栏中的“我的资源”,查看所有资源的剩余量列表详情。 如果计费项支持按需计费,可按需开通或关闭按需计费,详细操作如下所示: 如需开通按需计费,需单击“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。
查看名片 如果用户需要查看已生成的分身数字人名片,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“分身名片”页签,如图1所示。 在“分身名片”页面,可以看到已生成的名片列表,以卡片形式排列展示。 支持对名片进行如下操作: 单击,查看分身数字人的语音表达形态。
设置完成后,单击“生成视频”,弹出如图2所示的对话框,显示照片数字人视频的生成进度。 可执行下述操作: 单击图中第一个链接“任务中心-视频”,可进入“任务中心 > 照片数字人”页面,查看任务进度,详情请参见查看任务。 单击图中第二个链接“我的创作-视频”,可进入“我的创作 > 视频”界面,查看已生成的视频,详情请参见查看视频。
在画布区域,设置角色、背景、贴图、视频等内容。 详细操作请参见视频制作素材操作详情。 画布制作完成后,再制作语音。 选择“文本驱动”的方式。在文本输入框中,输入文本内容,以生成音频,如图2所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物
使用本接口前,需要在MetaStudio控制台服务概览页面,开通“声音合成”的按需计费。 详细操作为:单击“声音合成”卡片中的“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。开通后的效果如图1所示。 如需使用第三方声音进行语音合成,请购买出门问问声音套餐。 图1 声音合成