云服务器内容精选

  • 问题原因 由于Chrome等浏览器只支持硬解码H265(HEVC)视频,当您的PC硬件不支持解码H265(HEVC)视频时,Chrome等浏览器将无法播放H265(HEVC)视频,并获取不到视频分辨率等参数。 在Chrome浏览器中输入“chrome://gpu”后,搜索“coding”。可以检查当前PC的浏览器是否支持H265(HEVC)视频解码。 图2 查看浏览器配置 用ffmpeg检查视频的编码是否是H265(HEVC),输入命令:ffmpeg -i 视频文件名。 图3 检查视频是否是hevc编码 需要先安装ffmpeg,安装方法如下。 ffmpeg下载地址:https://github.com/BtbN/FFmpeg-Builds/releases。 ffmpeg解压后,将其下bin目录加入系统环境变量。 输入命令行ffmpeg后可以显示版本号,说明安装成功。
  • 模特形象 分身数字人不支持替换衣服,因此,您在录制时的着装会决定您的数字人穿着。 在拍摄前,我们建议参照如下条目,对您的形象进行检查。 着装要求 避免任何会和背景融为一体的衣服颜色。如绿幕背景下,不能穿绿色的衣服或者含有任何绿色图案的衣服。 避免半透明、透光、反光的材质,避免穿带人脸图案的衣服,避免过多褶皱。 避免穿着密集条纹、密集方格、密集斑点等衣服,可能会导致相机成像时有摩尔纹。 避免穿戴反光、绿色成分的手表、耳钉等佩饰。不能佩戴项链或者颈链。 图4 着装要求 面部要求 保持干净整洁的妆面造型,淡妆出镜,避免脸部过油导致反光。 不佩戴眼镜、墨镜或者帽子,需要露出额头与眉毛。 确保面部无零散发丝,保证无法通过头发空隙看到背景。 确保面部没有较长零散的胡须。 图5 错误示例 图6 正确示例
  • 视频提交 视频提交的详细说明,如表4所示。 表4 视频提交说明 视频要求项 说明 交付内容 拍摄完成后请提交一个视频素材。 推荐视频格式为MP4。 视频大小通常小于5G。 提交训练的视频需要保留录制时的原声。 若对素材进行后处理,导出时请确保帧率与原视频保持一致。 时长 视频时长通常为5~6分钟。请勿剪辑视频长度,确保讲述视频、静默、手势,一起导出至同一个视频中。 美颜 如需对视频进行美颜等处理,确认美颜效果后,检查素材,确保不存在变形、模糊、晃动等情况,可提交训练视频。 裁剪 在指定时长内,包含主播身体的所有部分都要入镜,并剪切掉人像周围其他不必要元素,如绿幕边缘、拍摄设备等。 命名 命名规范:公司名 + _ + 模特名称 + _ + 拍摄时间(YYYYMMDD)。 示例:华为云_云玲_20230925.mp4
  • 绿幕数字人拍摄要求 模特拍摄时的手部动作、面部表情以及各方面姿态,都会决定数字人最终呈现时的姿态和动作。因此,我们希望模特在拍摄时尽可能保持自然,按照平时说话和表达的习惯进行录制。 为了保证数字人训练的效果,请按照我们提供的流程进行录制,请根据实际需求评估录制流程: 不需要交互:15~20秒静默 + 4~5分钟自然表达 需要交互:15~20秒静默 + 无语义动作 + 4~5分钟自然表达,详见交互数字人拍摄要求。 需要动作编排:15~20秒静默 + 4~5分钟自然表达 + 单独拍摄动作编排片段(保持机位和人物位置不动,详细要求见附录二:动作编排定制采集指南) 详细录制说明,如下所示: 静默期:录制静默的初始人物状态,时长约15-20秒 模特正视镜头,面带微笑,嘴巴闭合,保持静默。手部可根据习惯自然放于初始位置,如下图所示。 保持合适的人物比例。 图7 静默期 自然表达期:录制自然说话时的嘴型、动作、状态、神情等,时长约4分30秒。 按照语料逐段演讲,保持自然语速和小幅度动作,头部可自然摆动。 图8 画面演示 停顿时保证完全合上嘴唇,手部恢复至初始位置(建议在拍摄前简单练习) 图9 错误示例 图10 正反示例 录制注意事项:
  • 灯光布置 合适的灯光环境将大幅提升模特的拍摄效果,我们建议: 使用3~4台专业摄影灯进行打光,包括:主光、辅助光、产品光(若需要拍摄桌面产品)、背景光、轮廓光(可选),具体布光方式参考图3。 图3 布置灯光 录制保证过程中保证光线不发生显著变化。 确保背景上的绿幕均匀明亮,避免阴影或明暗不均的情况。同时确保演员或物体与绿幕背景之间没有阴影或反光。 FAQ: 如果我没有这么多灯光设备,怎么办? 无需过于担心,只要保证人物被均匀、稳定地照亮,并且能清晰地和背景形成区分即可。注意要保证脸部和身体没有出现明显的阴影。在灯光设备有限的情况下,优先打亮被拍摄主体,之后再去对绿幕进行补光。
  • 收音 我们会使用视频中的语音和您口型变化的对应关系来训练口型驱动效果,训练结果还会经过专家的技术审核。 因此在收音这方面,我们建议: 保证视频音画同步。 确保环境安静无噪声,模特人声清晰,无其他人声干扰,尽量减少视频的底噪。 建议使用小蜜蜂或者其他专业麦克风搭配相机进行拍摄,这将大幅减少视频的底噪和其他环境噪声。但是注意:请尽量隐藏麦克风不被拍摄到,否则会导致数字人的形象中也包含麦克风。 FAQ: 如果我拍摄过程中有人闯入或有突发的声音,如雷声、汽车喇叭声等,我是否要重新拍摄? 根据我们的经验,小于3秒的短暂声音闯入不会对最终训练效果有明显的影响。您只需保证类似的突发声音越少越好。 我可能没有专业麦克风或者小蜜蜂设备,能否直接使用相机内置麦克风录制? 大部分相机内置麦克风的录制效果也能满足我们对声音的要求。我们对声音的清晰度可以有适度的妥协,但请务必保证底噪不能太大,且不能有其他人声出现,尤其是被拍摄模特正在说话的时候。
  • 附录一:拍摄检查项 拍摄完成后,可逐行检查拍摄的视频是否满足标准。 表5 检查项 检查项 是否满足 模特未说话时嘴巴保持闭合 绿幕上没有明显阴影 演员脸部和头部未出现碎发或零散发丝 演员全程未挪动位置 演员眼睛未明显观看提词器 视频长度大于等于5分钟 演员未穿着绿色或带有绿色图案的衣服 演员未穿戴反光的金属耳饰、手链、手表 演员未穿带半透明、透光、反光材质的衣服 演员未佩戴眼镜、墨镜、帽子 演员做手势时未超出画面 演员已将麦克风隐藏,无法直接看到 视频中未包含含义明确的动作,比如竖大拇指、比数字等 演员动作幅度适当,未遮挡面部
  • 相机架设&拍摄规格 注意要点: 建议选用与40mm-85mm焦距等效镜头,避免使用超广角。 在合适的高度,将相机竖置固定于三脚架上,确保水平。相机与人物眼神平齐,对焦于面部区域(参考图1),确保面部清晰不失焦。若录制全身,请确保模特脚底有绿幕空隙。 图1 相机机位参考图 建议使用相机竖拍。模特处于相机拍摄画框中间,与画框保持边距,确保模特做手势时不会越出画面。参见图2。 图2 拍摄示例 避免拍摄人物出现过曝、欠曝。 模特建议距离绿幕背景1.5米以上,避免出现阴影。 推荐的相机拍摄规格清单,如表1所示。 表1 相机拍摄规格 拍摄规格 标准 分辨率和帧率 4K/25fps及以上 光圈 小于F4,避免景深过浅出现明显虚化 ISO 100~800,避免ISO过高出现噪点 白平衡 3500~5500K,全程固定白平衡。 录制格式 H.264/H.265编码 码率 大于60M 颜色位深 10bit或8bit 快门速度 至少小于等于“1/(帧率 * 4)”。 如帧率60,则快门速度小于1/240。 FAQ: 如果我的设备不能拍摄4K视频,只支持1080P怎么办? 若设备不支持,可尝试使用1080P(1080*1920)半身拍摄,以确保人脸区域的细节捕获。 我没有相机,能否使用手机拍摄 ? 目前我们不建议使用手机拍摄。若实在需要,请将手机录制规格调整为4K/30fps或者4K/60fps,并使用稳定器保证画面稳定。其他拍摄要求如光线、绿幕等和相机架设&拍摄规格保持一致。
  • 附录一:拍摄检查项 拍摄完成后,可逐行检查拍摄的视频是否满足标准。 表6 检查项 检查项 是否满足 模特未说话时嘴巴保持闭合 绿幕上没有明显阴影 演员脸部和头部未出现碎发或零散发丝 演员全程未挪动位置 演员眼睛未明显观看提词器 视频长度大于等于5分钟 演员未穿着绿色或带有绿色图案的衣服 演员未穿戴反光的金属耳饰、手链、手表 演员未穿带半透明、透光、反光材质的衣服 演员未佩戴眼镜、墨镜、帽子 演员做手势时未超出画面 演员已将麦克风隐藏,无法直接看到 视频中未包含含义明确的动作,比如竖大拇指、比数字等 演员动作幅度适当,未遮挡面部
  • 视频提交 视频提交的详细说明,如表5所示。 表5 视频提交说明 视频要求项 说明 交付内容 拍摄完成后请提交一个视频素材。 推荐视频格式为MP4。 视频大小通常小于5G。 提交训练的视频需要保留录制时的原声。 若对素材进行后处理,导出时请确保帧率与原视频保持一致。 时长 视频时长通常为5~6分钟。请勿剪辑视频长度,确保讲述视频、静默、手势,一起导出至同一个视频中。 美颜 如需对视频进行美颜等处理,确认美颜效果后,检查素材,确保不存在变形、模糊、晃动等情况,可提交训练视频。 裁剪 在指定时长内,包含主播身体的所有部分都要入镜,并剪切掉人像周围其他不必要元素,如绿幕边缘、拍摄设备等。 命名 命名规范:公司名 + _ + 模特名称 + _ + 拍摄时间(YYYYMMDD)。 示例:华为云_云玲_20230925.mp4
  • 操作步骤 登录MetaStudio控制台。 单击“分身形象制作”下方的“开始创建”,进入分身形象制作页面。 界面左侧是定制分身数字人的数据上传界面。 界面右侧上方,展示分身数字人定制流程。下方展示训练视频拍摄指导和样例视频,包括:拍摄前准备、拍摄中操作和拍摄后处理,有效指导用户拍摄生成一段完整可用的训练视频,用于训练生成分身数字人。 图1 定制数字人形象 上传分身数字人训练数据。 界面操作详情,如表1所示。 表1 界面操作说明 区域 参数 说明 分身数字人训练数据上传 角色名称 输入分身数字人的角色名称。 示例:云笙。 训练视频 从本地上传已录制好,且符合拍摄要求的真人人像视频,训练生成数字人形象。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄。支持MP4、MOV格式的视频。 训练生成的分身数字人形象与真人形象完全相同。 背景替换 分身数字人是否支持更换背景。 包含如下选项,请根据实际情况选择: 抠除拍摄背景:制作分身数字人视频时,可以更换背景。 保留拍摄背景:分身数字人使用拍摄时的原背景,不支持更换背景。 身份认证及授权数据上传 联系方式 请输入有效的11位手机号码。 身份证照片 需要分别上传身份证人像面和国徽面的照片。 单击“点击上传人像面”,从本地选择身份证人像面照片上传。 单击“点击上传国徽面”,从本地选择身份证国徽面照片上传。 形象授权 上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 授权书内容,可参考授权书。 单击“提交制作”。 数据上传完成后,界面提示“制作任务提交成功!”,如图2所示。 数字人定制任务提交成功后,会在1个工作日内完成审核。任务审核通过后,才能进行算法训练,会在3个工作日内训练完成并生成数字人。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,进入分身数字人定制任务列表页面。 单击任务所在行的“查看详情”,进入“定制任务详情”页面。 查看分身数字人定制任务审核进展。当前状态为“系统审核中”,需要等待服务管理员审核通过后,状态变更为“待算法训练”。 如果数字人定制任务被驳回,需要查看驳回原因,并重新按照要求录制视频并上传。 操作步骤详情如下所示: 在服务主界面,单击左侧导航栏中的“任务中心”。 查看“分身数字人”页签的数字人定制任务列表,找到被驳回的数字人定制任务。 任务状态为“审核未通过”。 单击任务右侧的“查看原因”,在弹出的“审核未通过”对话框中,查看审核未通过的原因。 按照规范重新录制或提供符合规范的视频。 单击任务右侧的“重新上传”,上传更新后的视频。 数字人定制任务重新进入审核流程。
  • 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 在“分身数字人”页签,单击数字人定制任务右侧的“查看详情”,进入“定制任务详情”页面。 审核通过后,任务状态变更为“算法训练中”,如图1所示。 图1 数字人定制任务 数字人模型会在3个工作日内训练完成。训练完成后的任务状态更新为“算法训练完成”,如图2所示。 查看生成的分身数字人形象是否满足。用户可以在当前界面,执行下述操作。 单击右上角的“编辑”,为数字人添加标签。标签添加完成后,单击“保存”,保存修改。 如果训练生成的数字人形象满足需求,单击右下方的“通过”。在弹出的“确认”对话框中,单击“确认”,数字人形象生成完成。 如果训练生成的数字人形象不满足需求,单击右下方的“驳回”,进入“问题填写”界面。 输入“问题标题”、“问题描述”,并上传相应的附件,如更新后的绿幕视频文件等内容。如果存在多个问题,可以单击界面右上角的“添加问题”,增加多个问题描述。问题全部添加完成后,单击“确认”,等待服务管理员处理。 用户也可以单击“定制任务详情”页面左上方的“返回”,回到任务列表界面,通过任务列表右侧的“同意”或“驳回”实现数字人形象的验收操作。 图2 数字人定制任务 服务管理员会根据用户反馈的问题,重新优化数字人形象。 数字人定制任务,会重新进行模型训练。等待模型训练完成后,用户可以二次审验,继续4的操作,直至生成符合要求的分身数字人形象。 此时,在如下界面,可以看到新增的数字人形象卡片。 在MetaStudio控制台首页“最近项目”区域,“我的数字人”页签中查看。 在“我的创作”菜单页面的“分身形象”页签中查看,如图3所示。 图3 用户数据页面
  • 响应示例 状态码: 200 处理成功返回。 { "commond_result" : "EXCUTE_SUC CES S" } 状态码: 400 { "error_code" : "MSS.00000003", "error_msg" : "Invalid parameter" } 状态码: 500 { "error_code" : "MSS.00000004", "error_msg" : "Internal Error" }
  • 响应参数 状态码: 200 表5 响应Header参数 参数 参数类型 描述 X-Request-Id String 请求ID。 表6 响应Body参数 参数 参数类型 描述 commond_result String 命令执行结果。 EXCUTE_SUCCESS: 命令提交成功 EXCUTE_FAILED: 命令提交失败 attachment_upload_url Array of strings 附件上传地址 multipart_data Array of MultipartUploadInfo objects 训练视频已上传分片信息 表7 MultipartUploadInfo 参数 参数类型 描述 part_number String 分片编号 etag String 分片文件标识 状态码: 400 表8 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误描述。 状态码: 500 表9 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误描述。
  • 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用 IAM 服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。 X-Project-Id 否 String 使用AK/SK方式认证时必选,携带项目ID信息。 X-App-UserId 否 String 第三方用户ID。 说明: *不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 command 是 String 命令类型。 SUBMITVERIFYING: 提交审核 CONFIRM_ACCEPT:用户确认训练效果 CONFIRM_REJECT:用户驳回训练效果 CONFIRM_ANSWER:用户答复 CONFIRM_PENDING:用户挂起任务 CONFIRM_ACTIVE:用户激活任务 GET_MULTIPART_UPLOADED:获取已上传分片信息 CONFIRM_MULTIPART_UPLOADED:确认视频所有分片文件已上传 说明: CONFIRM_ACCEPT/CONFIRM_REJECT/CONFIRM_ANSWER/CONFIRM_PENDING/CONFIRM_ACTIVE命令仅NA白名单用户可用。 command_message 否 String 命令类型: UPDATE_VIDEO: 更新视频 UPLOAD_VIDEO: 上传视频 comment_data 否 CommentData object 提交的评论信息。 表4 CommentData 参数 是否必选 参数类型 描述 comment_title 否 String 标题。 comment_message 否 String 消息。 attachment_name 否 Array of strings 附件名字