检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
赠品库存有限,咱先到先得! 这波赠品库存仅剩最后几单,全凭手速,手快有手慢无! 你再犹豫你再纠结,就被拍完、就被抢完了哈! 有任何问题都可以直接来直播间找到客服的,我们做到售后无忧有保障。 现在在直播间下单的宝子,主播都可以帮你安排明天提速发货的。 新进直播间的宝宝们,动动你们的小手给主播点点赞,点赞过万就抽奖
给用户组授权之前,请您了解用户组可以添加的MetaStudio系统策略,并结合实际需求进行选择。 MetaStudio支持的系统策略请参见MetaStudio系统策略。若您需要对除MetaStudio之外的其它服务授权,IAM支持服务的所有策略请参见系统权限。 示例流程 图1 给用户授权MetaStudio权限流程
设置视频的场景,包括如下内容。视频素材的操作详情,请参考视频制作公共配置。 模板:系统预置视频模板列表。支持基于系统预置模板,一键快速制作数字人视频。 注意:只有管理员可以自定义新增模板。 角色:自动展示系统预置的分身数字人列表,用户可以直接使用已有的数字人去创作生成视频。如果预置的数
频制作”,详见计费说明。 系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明。 系统声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。
启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。 确认声音制作任务已训练完成后,在左侧导航栏中,单击“我的创作”。
ffmpeg下载地址:https://github.com/BtbN/FFmpeg-Builds/releases。 ffmpeg解压后,将其下bin目录加入系统环境变量。 输入命令行ffmpeg后可以显示版本号,说明安装成功。 解决方法 方法一:通过剪映将H265(HEVC)视频的格式转码为H26
高品质:约5个工作日。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。 父主题: 声音制作
时约5个工作日。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。 父主题: 声音制作
的任务分身数字人训练耗时约3小时,请耐心等待。 单击任务所在行的“查看详情”,进入“定制任务详情”页面。 查看分身数字人定制任务审核进展。系统会自动审核任务,并提交训练任务。 等待Flexus分身数字人训练完成后,单击任务行右侧的“更多 > 查看详情”,再次进入“定制任务详情”页面。
文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考购买出门问问声音套餐。 设置完成后,单击“生成
所示。 图3 任务列表 单击任务所在行的“查看详情”,进入“定制任务详情”页面,如图4所示。 查看分身数字人定制任务审核进展,当前状态为“系统审核中”。数字人定制任务提交成功后,会在1个工作日内完成审核。 图4 定制任务详情 审核通过后,任务状态变更为“算法训练中”,如图所示。
如表1所示,包括了MetaStudio的所有系统策略。 表1 MetaStudio系统权限 策略名称 描述 策略类别 策略内容 MetaStudio FullAccess MetaStudio管理员权限,拥有该权限的用户可以拥有MetaStudio支持的全部权限。 系统策略 MetaStudio FullAccess策略内容
文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考购买出门问问声音套餐。 请填写名片信息 姓名 必填项,数字人姓名。
错误码 获取项目ID 获取账号ID 直播控制HTTP Command命令说明 直播控制RTSA Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值 预置音色ID列表 查询音色ID
音频经过人工安全审核和授权认证后,由训练人员标注用于训练的音频数据,使用深度学习算法训练生成数字人声音模型。 推理阶段: 用户上传一段文本作为输入文本内容,由系统自动审核。 输入文本使用数字人声音模型推理生成数字人语音。 算法应用场景 分身数字人声音制作算法可以应用于数字人语音合成。在新闻播报、课件
视频方向可能不对,竖屏横拍的素材需要旋转,确保被拍摄对象为竖向。 视频为非主流编码格式,可能是相机拍摄的视频采用了厂商的特定编码。需确保视频素材能通过Windows系统自带的播放器播放(须知编码与封装格式为不同的概念)。 父主题: 声音和形象制作
用户可以单击“查看制作任务列表”,进入分身数字人定制任务列表页面。 单击任务所在行的“查看详情”,进入“定制任务详情”页面。 查看分身数字人定制任务审核进展。当前状态为“系统审核中”,需要等待服务管理员审核通过后,状态变更为“待算法训练”。 如果数字人定制任务被驳回,需要查看驳回原因,并重新按照要求录制视频并上传。
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
文本界面说明,如表6所示。 表6 界面元素说明 界面元素 说明 界面默认展示两列文本,单击图标后,缩小展示为1列文本。单击图标,可恢复为2列展示。 文本列表 系统支持的文本列表。字体分别为:鸿蒙常规、鸿蒙粗体、鸿蒙细体、鸿蒙中黑。 插入文本 将鼠标放在文本上方,文本右上角展示图标。单击图标,添加至当前场景的视频直播画面中。
disable_system_watermark 否 Boolean 参数解释: 输出的视频是否关闭系统水印。 约束限制: 目前该参数需要白名单的租户才起作用。 取值范围: true: 关闭系统水印 false: 不关闭系统水印 默认取值: false dx 否 Integer 参数解释: 裁剪视频左上角像素点横坐标。