检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
更新分身数字人模型训练任务 功能介绍 该接口用于更新分身数字人模型训练任务。用于在自动审核或者人工审核不通过情况下,更新训练视频、身份证照片等。 该接口只能在AUTO_VERIFY_FAILED或者MANUAL_VERIFY_FAILED状态下调用 调用方法 请参见如何调用API。
TextLayerConfig 参数 是否必选 参数类型 描述 text_context 否 String 参数解释: 文字图层的文本,内容需做Base64编码。 示例:若想添加文字水印“测试文字水印”,那么text_context的值为:5rWL6K+V5paH5a2X5rC05Y2w
创建分身数字人模型训练任务 功能介绍 该接口用于创建分身数字人模型训练任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-training-manage/user/jobs 表1 路径参数 参数 是否必选 参数类型
TextLayerConfig 参数 是否必选 参数类型 描述 text_context 否 String 参数解释: 文字图层的文本,内容需做Base64编码。 示例:若想添加文字水印“测试文字水印”,那么text_context的值为:5rWL6K+V5paH5a2X5rC05Y2w
Web语音唤醒 产品预置了唤醒能力,详见预制唤醒能力,如果用户需要更新唤醒词,需要参考定制唤醒能力处理。唤醒模型定制完成后,产品会提供给用户,用户需要参考更新唤醒模型,将模型更新至本地模型路径中。 使用要求 WebSDK版本为3.0.1及以上。 仅支持数字人平台配置或内置ASR(
TextLayerConfig 参数 是否必选 参数类型 描述 text_context 否 String 参数解释: 文字图层的文本,内容需做Base64编码。 示例:若想添加文字水印“测试文字水印”,那么text_context的值为:5rWL6K+V5paH5a2X5rC05Y2w
TextLayerConfig 参数 是否必选 参数类型 描述 text_context 否 String 参数解释: 文字图层的文本,内容需做Base64编码。 示例:若想添加文字水印“测试文字水印”,那么text_context的值为:5rWL6K+V5paH5a2X5rC05Y2w
制作照片数字人视频 支持上传正面清晰的人像照片,生成会说话的照片数字人视频。 操作限制 照片数字人视频制作限制,如照片数字人限制所示。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“照片数字人”,进入照片数字人制作页面,如图1所示。 界面左侧展示配置项,右侧展示预览效果。配置操作,请参考表1。
配置对话机器人服务CBS 在对话机器人服务配置问答机器人。MetaStudio创建对话时,如果“第三方应用”需要选择“华为云CBS”时,才需要执行本节操作,详情请参考表1。 操作步骤 登录MetaStudio控制台。 单击界面左上角的图标,在弹出的浮动框中,搜索“对话机器人服务 CBS”,如图1所示。
视频制作 用户可以使用MetaStudio控制台首页的“分身视频制作”功能,制作数字人视频。 操作前准备 如果系统预置形象不满足要求,请参考形象制作,提前定制符合要求的分身数字人形象。 操作限制 MetaStudio控制台预置形象的有效使用期为3年,在2027年的年中前可放心使用
-1 表12 TextLayerConfig 参数 参数类型 描述 text_context String 参数解释: 文字图层的文本,内容需做Base64编码。 示例:若想添加文字水印“测试文字水印”,那么text_context的值为:5rWL6K+V5paH5a2X5rC05Y2w
创建文件并获取上传URL 功能介绍 该接口用于创建文件并获取上传URL。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/files 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。
创建声音制作任务(自研模型) MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用自研模型自定义生成声音。 操作限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书
创建科大讯飞应用(星火交互认知大模型) 在科大讯飞创建星火交互认知大模型的应用。详细操作如下所示: 星火交互认知大模型应用,不支持直接切换为AIUI通用语义模型,不适用。建议参考创建科大讯飞应用(AIUI通用语义模型)单独为其创建应用。 创建应用 (可选)创建问答库 配置应用 查看应用信息
TextLayerConfig 参数 是否必选 参数类型 描述 text_context 否 String 参数解释: 文字图层的文本,内容需做Base64编码。 示例:若想添加文字水印“测试文字水印”,那么text_context的值为:5rWL6K+V5paH5a2X5rC05Y2w
修订记录 表1 修订记录 修改时间 修改说明 2024-12-30 本次变更如下: 新增发布3.0.1版本SDK,相比2.2.0版本,变更点如下所示: 新增语音唤醒能力,详见Web语音唤醒。 新增接口initResourcePath,支持设置语音唤醒算法以及资源路径,保证正常使用语音唤醒能力。
创建声音制作任务(第三方模型) MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用第三方模型“出门问问”自定义生成声音。第三方模型“出门问问”的详细说明,如下所示: 输入的语言不受限制。默认支持19种输入语言
示例1:上传资产 本节提供通过API Explorer和Postman工具,将资产上传至OBS桶的操作。 总体流程 调用创建资产接口创建资产ID。 调用创建文件并获取上传URL接口创建文件ID,并生成文件上传的URL地址。 使用Postman工具,参考OBS的PUT上传接口,将资产文件上传至URL地址中。
构造请求 本节介绍REST API请求的组成,并以调用IAM服务的管理员创建IAM用户来说明如何调用API,该API获取用户的Token,Token可以用于调用其他API时鉴权。 您还可以通过这个视频教程了解如何构造请求调用API:https://bbs.huaweicloud.com/videos/102987。
创建科大讯飞应用(AIUI通用语义模型) 在科大讯飞创建AIUI通用语义模型的应用。详细操作如下所示: AIUI通用语义模型应用,不支持直接切换为星火交互认知大模型,不适用。建议参考创建科大讯飞应用(星火交互认知大模型)单独为其创建应用。 创建应用 配置应用 查看应用信息 (可选)开启闲聊功能