检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
不通过则不进行数据生成和结果返回操作。 将视频图片输入至算法模型中,将视频图像分割为面部、手部和身体三个区域。 使用深度学习算法,识别面部区域转化为面部表情,识别手部区域转化为手部骨骼驱动数据,识别身体转化为人体骨骼驱动数据。 对算法输出系数进行平滑处理及异常数据过滤,返回结果。
String 输出数据的格式版本,如请求中无此参数,则输出数据格式为1.0,可选值有: 1.0: 对应的输出为: 动作数据:75个骨骼旋转值 表情数据:52ARkit表情及参数 2.0: 对应的输出为: 动作数据:55个骨骼旋转值+骨骼3D坐标 表情数据:178个控制器的数据 状态码: 400
约束限制: 不涉及。 取值范围: 只能使用中英文字符,字符长度0-256位。 默认取值: 不涉及。 asset_description 否 String 参数解释: 资产描述。 约束限制: 不涉及。 取值范围: 只能使用中英文字符,字符长度0-4096位。 默认取值: 不涉及。 asset_type
object 分身模型元数据 image_meta ImageAssetMeta object 图片元数据 video_meta VideoAssetMeta object 视频元数据,自动提取获得。 audio_meta AudioAssetMeta object 音频元数据,自动提取获得。
约束限制: 不涉及。 取值范围: 只能使用中英文字符,字符长度0-256位。 默认取值: 不涉及。 asset_description 否 String 参数解释: 资产描述。 约束限制: 不涉及。 取值范围: 只能使用中英文字符,字符长度0-4096位。 默认取值: 不涉及。 asset_type
声音资产(包括制作任务)、合成的视频(包括剧本和任务)、直播间,智能交互项目等,全部可共享使用。 前提条件 MetaStudio控制台默认不展示“子账户隔离配置”菜单,需提交工单,并提供当前华为云账号所在Region的项目ID(详见获取项目ID),申请开通后展示。 开通成功后,仅
服务概览 登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线 MetaStudio”服务,进入MetaStudio服务概览页面,如图1所示。 图1 服务概览页面 MetaStudio服务概览页面一共包含3块区域,详细说明如下所示: 服务介绍
界面左侧是定制分身数字人的数据上传界面。 界面右侧上方,展示分身数字人定制流程。下方展示训练视频拍摄指导和样例视频,包括:拍摄前准备、拍摄中操作和拍摄后处理,有效指导用户拍摄生成一段完整可用的训练视频,用于训练生成分身数字人。 图1 定制数字人形象 上传分身数字人训练数据。 界面操作详情,如表1所示。
object 分身模型元数据 image_meta ImageAssetMeta object 图片元数据 video_meta VideoAssetMeta object 视频元数据,自动提取获得。 audio_meta AudioAssetMeta object 音频元数据,自动提取获得。
user_type String 用户类型。 CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看
如何帮助客户快速构建安全合规的自动驾驶研发平台? 自动驾驶具备安全合规、数据管理高效、算法训练高效、生态开放等优势。 华为云|自动驾驶 图3 技能编辑页面 表3 问答对 参数 说明 主题 输入主题,便于问题查找,不包含问题内容。 所有问法 输入所有提问方式。问法包括同一个问题的不同提问方式。
String 输出数据的格式版本,如请求中无此参数,则输出数据格式为1.0,可选值有: 1.0: 对应的输出为: 动作数据:75个骨骼旋转值 表情数据:52ARkit表情及参数 2.0: 对应的输出为: 动作数据:55个骨骼旋转值+骨骼3D坐标 表情数据:178个控制器的数据 状态码: 400
英文 默认取值: CN create_type 否 String 任务创建方式。 PACKAGE: 使用一个zip包包含所有数据 SEGMENT: 逐句上传数据 phone 否 String 手机号 dhtms_job_id 否 String 形象制作任务id batch_name
支持流式文本消息。seq为流式文本序号,从1开始计数;is_last用于判断流式文本的最后一包数据。如果不使用流式文本消息,seq设置为“1”,is_last设置为“true”。 建议每个分包数据长度大于6个字,否则可能会导致数字人说话卡顿。 详细交互流程如下所示: 用户发送文本驱动消息。
从直播平台获取推流地址。获取方式各平台入口不一,建议咨询对应的直播平台。在MetaStudio服务这里仅需输入推流地址,即可直推平台。 推流即RTMP直推,华为云服务器直接把画面传到直播平台服务器,不需要用户一直打开控制台。 如果直播平台无法提供推流地址,可通过窗口捕获方式开播。 需要注意: 使用RTMP推流时,关闭
user_type String 用户类型。 CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看
user_type String 用户类型。 CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看
user_type String 用户类型。 CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看
背景界面说明,如表2所示。 表2 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择PNG、JPG、JPEG和BMP格式的图片上传。也可直接将图片拖拽至图片列表区域。 背景搜索框,可输入背景名称进行精准搜索。 示例:科技。 筛选条件 支持通过来源筛选展示背景图片。 图片列表 默认展
描述 asset_id String 资产ID。 asset_info String 加密后的资产信息。 encryption_info ReplicationEncInfo object 加密信息 expire_time Long 过期时间 取值范围: 0-9223372036854775807