检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择“未激活”页签,单击已接收资产卡片中的“激活”,在弹出的“提示”对话框中,单击“确认”。 界面提示“资产已激活”,说明资产已激活成功。用户可以在“已激活”页签中查看已激活的分身模型资产。 图4 激活资产 完成上述操作后,声音和分身模型资产已经在当前账号下生效,用户可以使用已激活的资产进行视频制作或视频直播。
作”为例,进行操作演示。 前提条件 当前用户已拥有SP账号。 操作步骤 使用SP用户登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线 MetaStudio”服务,进入MetaStudio服务概览页面,如图1所示。 图1 服务概览页面 单击
选择“未激活”页签,单击已接收资产卡片中的“激活”,在弹出的“提示”对话框中,单击“确认”。 界面提示“资产已激活”,说明资产已激活成功。用户可以在“已激活”页签中查看已激活的分身模型资产。 图4 激活资产 完成上述操作后,声音和分身模型资产已经在当前账号下生效,用户可以使用已激活的资产进行视频制作或视频直播。
在Chrome浏览器中输入“chrome://gpu”后,搜索“coding”。可以检查当前PC的浏览器是否支持H265(HEVC)视频解码。 图2 查看浏览器配置 用ffmpeg检查视频的编码是否是H265(HEVC),输入命令:ffmpeg -i 视频文件名。 图3 检查视频是否是hevc编码
导出为:输入导出文件的名称。 画质增强:开启后将提升视频清晰度,合成时间相应变长。请根据实际情况确定是否开启。 单击“确定”,弹出“视频制作任务中心”对话框。 可查看视频合成任务的进度,直至合成成功。 单击“合成成功”状态右侧的图标,进入视频详情页面,如图4所示。 单击“预览”,可以看到合成的视频。预览过程中,可全屏播放,或下载视频到本地。
parents are disabled, and the family lives in poverty. Despite the hardships of life and training, he never gives up. His hard work paid off,
页面的行为。 浏览器通过有上述点击的行为,才能获取采集声音的权限。否则无法采集声音,无法正常使用语音唤醒能力。 浏览器使用限制,请参见表1。 表1 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器 91+ Edge浏览器 91+ Android
登录MetaStudio控制台,单击“智能交互”。 在智能交互编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。 参数配置说明,如表1所示。 图1 创建应用 表1 创建应用 参数 说明 第三方应用 从下拉框中选择“第三方驱动”。 应用名称 输入自定义的应用名称。
请求发送以后,您会收到响应,其中包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于管理员创建IAM用户接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应请求消息头,响应同样也有消息头,如“Content-type”。
字人模型,生成效率相比业界提升3倍以上。在数字人模型生成以后,可以通过模型驱动推理服务,让数字人动起来,包括声音、表情、口型、肢体动作等,口型匹配准确率>95%,表情、动作更自然。 直播话术智能生成:基于十万级高质量直播话术的预训练,自动生成专业话术,精准驱动数字人准确、流利地介绍产品,让每个人都能成为专业的主播。
上角会有标识。 背景:背景图片列表,可本地导入图片。支持透明背景、纯色背景或导入图片。 PPT:PPT文件列表,需要用户从本地导入后使用。 贴图:各类贴图列表,可本地导入素材。支持在当前画面基础上,增加贴图,丰富视频画面。 视频:各类无声音视频列表,可本地导入视频文件。支持添加为背景视频。
应功能为视频制作、视频直播和智能交互,主要是生成画面内容。也可以直接通过静态的人脸照片生成视频,对应功能为照片数字人。 功能详情,如表1所示。 表1 功能特性 功能名称 功能描述 形象制作 拍摄真人视频,建模生成数字人形象。 数字人形象可用于生成音视频内容,应用于视频制作、视频直播和智能交互。
视频直播制作界面如图2所示。各区域详细说明,如表1所示。 图2 视频直播制作界面 表1 界面说明 区域 说明 ① 素材区域,包括如下内容。视频直播素材的操作详情,请参考视频直播公共配置。 模板:视频直播模板,“模板”页签仅管理员可见。 角色:数字人形象列表,可选择需要使用的数字人形象,支持自定义。
技能管理”,如图1所示。 图1 智能交互页面 单击右上方的“创建技能”,弹出“创建技能”对话框,如图2所示。 参数配置说明,如表1表1所示。 支持用户最多创建100个技能。 图2 创建技能 表1 创建技能 参数 说明 技能名称 技能名称,必须与科大讯飞创建的技能一一对应,如在科大讯飞创建同名技能并导入技能文件所示。
2:我们每个人都有自己的学习和工作,难免会遇到一些问题。当我们遇到问题的时候,应该如何解决的呢? 图2 文本驱动 文本内容的操作说明如表1所示。 不同声音对表1中操作的支持情况有差异。如果表1中操作项置灰,说明当前选择的声音不支持此操作。需要重新选择一个支持所需操作的声音模型,进行文本驱动设置。 表1 操作说明
请求ID。 表7 响应Body参数 参数 参数类型 描述 platform_id String 平台ID 状态码:400 表8 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误描述。 状态码:401 表9 响应Body参数
后,再上传至控制台使用。 图2 背景界面 背景界面说明,如表2所示。 表2 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择PNG、JPG、JPEG和BMP格式的图片上传。也可直接将图片拖拽至图片列表区域。 背景搜索框,可输入背景名称进行精准搜索。 示例:科技。
约为250字/分钟。 50表示0.5倍语速,100表示正常语速,200表示2倍语速。 取值范围:[50,200] 默认值:100 pitch 否 integer body 音高。 取值范围:[50,200] 默认值:100 volume 否 integer body 音量。 取值范围:[90
了丰厚的奖品,希望幸运的朋友们会喜欢这些礼物。 我们的直播间也会一直陪伴大家,继续努力,为大家带来更多有趣、有用的内容。 如果在直播过程中,大家有任何问题、建议或者想要进一步了解的内容,都欢迎在留言区留下你的意见,我们将尽力回答你们的疑问。 我们也会根据大家的反馈不断改进,提供更好的服务和直播体验。
限于如下: 有独立文本,不能作为用户协议的一部分。 App首次运行收集处理个人信息前需要以醒目方式提示用户阅读隐私政策。隐私政策需方便用户查看,例如用户在App主功能界面中通过4次以内的点击或滑动操作可访问。 描述语言需要清晰通俗,符合通用语言习惯,避免使用有歧义的语言。 隐私政