检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
更新分身数字人模型训练任务 功能介绍 该接口用于更新分身数字人模型训练任务。用于在自动审核或者人工审核不通过情况下,更新训练视频、身份证照片等。 该接口只能在AUTO_VERIFY_FAILED或者MANUAL_VERIFY_FAILED状态下调用 调用方法 请参见如何调用API。
YING、MANUAL_VERIFY_FAILED、TRAINING_DATA_PREPROCESS_FAILED、TRAIN_FAILED、INFERENCE_DATA_PREPROCESS_FAILED、JOB_SUCCESS、WAIT_USER_CONFIRM、JOB_REJECT、JOB_FINISH
Create2dModelTrainingJobRequest request = new Create2dModelTrainingJobRequest(); Create2dModelTrainingJobReq body = new Create2dModelTrainingJobReq();
抠图类型。默认是AI。 AI:AI抠图 MANUAL:人工抠图 默认取值: AI model_resolution String 分身数字人模型分辨率。默认是1080P。 1080P:1080P。支持1080P及720P的视频输出。 4K:4K。支持4K、1080P及720P的视频输出。
租户执行分身数字人模型训练任务命令 功能介绍 该接口用于租户执行分身数字人模型训练任务命令,如提交训练审核等。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-training-manage/user/jobs/{job_id}/command
speechRecognized的流式返回是覆盖式返回。后一条通知中的text字段值包含前一条通知的内容。例如:第一条通知的text值为“你吃”,第二条新识别了“饭了么”,则第二条text值为“你吃饭了么”。 semanticRecognized的流式返回是分段式返回。后一条通知中的text字段值
获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。
抠图类型。默认是AI。 AI:AI抠图 MANUAL:人工抠图 默认取值: AI model_resolution String 分身数字人模型分辨率。默认是1080P。 1080P:1080P。支持1080P及720P的视频输出。 4K:4K。支持4K、1080P及720P的视频输出。
场景、图片和音乐资产。 图2 上传资产 单击“图片”,进入“图片上传”页面,如图3所示。 请根据实际情况,配置下述信息: 资产标题:图片的标题。 图片简介:图片的基本介绍,方便了解和使用。 风格:关键词标签,方便用户搜索此类型的资产。 基本信息:图片的用途。 图3 上传图片 单击
功能介绍 该接口用于在资产库中添加上传新的媒体资产。可上传的资产类型包括:分身数字人模型、背景图片、素材图片、素材视频、PPT等。 资产类型是IMAGE时,通过system_properties来区分背景图片(BACKGROUND_IMG)、素材图片(MATERIAL_IMG)。 资产
开启卡片区域右上角的开关。 单击卡片区域右下角的开关,在弹出的“技能设置”对话框中选择需要使用的技能版本。 此时,应用已具备基础的对话能力,可以回答已配置的语料内容。 图4 配置应用需要的技能 单击右上方的“保存配置”。界面提示“保存成功”,回到“应用配置”页面。 单击界面右上方的“保存修
Flexus支持通过API集成使用吗? 支持,详见接口创建分身数字人模型训练任务的is_flexus字段。 父主题: API和SDK使用
用户与数字人进行智能交互的页面,富媒体展示效果支持使用SDK提供的默认展示方式。 下述智能交互客户端SDK的两个方法的配置字段enableCaption,默认值均为False,即用户自定义富媒体的展示效果。如果需要使用SDK提供的默认展示效果,需修改参数enableCaption的值为true。
满足批量生成数字人诉求,平台支持几百到上千的并发模型训练任务。 大幅提升数字人生产质量 模型质量提升30%以上,数字人名片迅速引流新阵地直播产品,业务推广无后顾之忧。 解决产品端到端服务能力 可接入其他AIGC产品,打造AIGC数字人视频生成到剪辑端到端的解决方案能力。 多行业多场景广泛应用
G和BMP格式的图片上传。 也支持直接拖拽本地图片至图片列表区域,完成上传操作。 关键词搜索框,可输入图片名称进行精准搜索。 示例:科技。 筛选条件 支持通过背景图片来源的维度,筛选展示下方的图片。 图片列表 默认展示全量图片。选中场景,单击图片,可以替换当前场景的背景。 第一张
闲聊功能可以丰富数字人可问答的内容,如:天气、旅游、假期等日常闲聊信息。 闲聊为可选功能,如需开启,可参考下述步骤进行操作: 在界面上方的主菜单中,单击“我的应用”。 进入“我的应用”页面,如图12所示。 图12 我的应用页面 单击应用所在行的图标,进入当前应用的“应用配置”页面。 开启应用的闲聊功能
通过视频抽帧得到单张图片。经过安全过滤,判断是否通过安全筛选,若不通过则不进行数据生成和结果返回操作。 将视频图片输入至算法模型中,将视频图像分割为面部、手部和身体三个区域。 使用深度学习算法,识别面部区域转化为面部表情,识别手部区域转化为手部骨骼驱动数据,识别身体转化为人体骨骼驱动数据。
45000012 图片数量超限 用户上传前景图片数量超过限制,目前是100张 要求用户减少图片数量 400 MSS.45000013 图片格式错误 用户上传的图片格式不支持 要求用户修改图片格式 400 MSS.45000014 图片解析失败 用户上传前景图片中有无法解析的图片 要求用户替换有问题的图片
机录制音频。 具体的录音注意事项,如表2所示。 表2 录音注意事项 录音事项 说明 话筒间距 调整与麦克风之间的距离,以一拳距离为宜。不宜离麦太近,防止喷麦或录入呼吸声。 录音内容 每句文案起始数字编号无需阅读。 示例:4. 它不仅拥有出色的功能,还具备卓越的性能,序号4无需阅读。
/v1/{project_id}/digital-human-training-manage/user/jobs 创建分身数字人模型训练任务 GET /v1/{project_id}/digital-human-training-manage/user/jobs 查询分身数字人模型训练任务列表 GET /v1/{p