检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。 取值范围: 字符长度1-2048位。 默认取值: 不涉及。 video_cover_url 否 String 参数解释: 视频封面文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。
在Chrome浏览器中输入“chrome://gpu”后,搜索“coding”。可以检查当前PC的浏览器是否支持H265(HEVC)视频解码。 图2 查看浏览器配置 用ffmpeg检查视频的编码是否是H265(HEVC),输入命令:ffmpeg -i 视频文件名。 图3 检查视频是否是hevc编码
导出为:输入导出文件的名称。 画质增强:开启后将提升视频清晰度,合成时间相应变长。请根据实际情况确定是否开启。 单击“确定”,弹出“视频制作任务中心”对话框。 可查看视频合成任务的进度,直至合成成功。 单击“合成成功”状态右侧的图标,进入视频详情页面,如图4所示。 单击“预览”,可以看到合成的视频。预览过程中,可全屏播放,或下载视频到本地。
控制数字人直播过程接口的Command命令说明,如下所示: Command命令为“GET_CURRENT_PLAYING_SCRIPTS”时,即查询本轮剧本列表。其响应结构定义为“LivePlayingScriptList”。 Command命令为“CLEAN_UP_INSERT_CO
仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。 取值范围: 字符长度1-2048位。 默认取值: 不涉及。 video_cover_url 否 String 参数解释: 视频封面文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。
注:黑字为建议口语文本。“<>”为动作文本。每个动作之间间隔3~4秒。 附录三:台本范例 可以选择下方任意一段示例稿进行阅读,阅读中出现错误、卡顿等不影响最终效果,相同内容最多重复两次。示例稿仅作参考,我们建议使用您自己熟悉的台本或直接脱稿演讲,流畅自然地演讲能够优先提升数字人的最终制作效果。 稿一:华为云MetaStudio介绍
xxxxx68", "is_stream": true } 响应示例 状态码:200 对应问答请求支持的二种方式,响应消息需要选择相同的方式,分别如下所示: 单轮非流式问答响应消息 示例代码,如下所示: { "id": "2f8e891225d486190c8bea91207e9aa1"
音色资产ID,可以从资产库中查询。 introduction_audio_asset_id 否 String 自我介绍语音资产ID,用于驱动数字人口型。 说明: 介绍语音需要作为asset_type=AUDIO资产先上传至资产库。 使用时从资产库中查询。 video_asset_name
单击文件名称右侧的图标,可自定义视频草稿的名称。 单击图标,保存视频制作任务。 单击图标,弹出“视频制作任务中心”对话框,可以看到视频制作任务列表,并查看当前视频的合成进展。 单击“合成视频”,合成数字人视频。 父主题: 视频制作
false: 不开启 默认取值: false is_end_at_first_frame 否 Boolean 参数解释: 视频结束帧是否跟起始帧相同。需要多个数字人视频无缝拼接时设置成true。 约束限制: 仅分身数字人视频制作支持。 取值范围 true: 开启 false: 不开启 默认取值:
导出为:输入导出文件的名称。 画质增强:开启后将提升视频清晰度,合成时间相应变长。请根据实际情况确定是否开启。 单击“确定”,弹出“视频制作任务中心”对话框。 可查看视频合成任务的进度,直至合成成功。 单击“合成成功”状态右侧的图标,进入视频详情页面,如图3所示。 单击“预览”,可以看到合成的视频。预览过程中,可全屏播放,或下载视频到本地。
音色资产ID,可以从资产库中查询。 introduction_audio_asset_id 否 String 自我介绍语音资产ID,用于驱动数字人口型。 说明: 介绍语音需要作为asset_type=AUDIO资产先上传至资产库。 使用时从资产库中查询。 video_asset_name
支持转移声音和模型资产给其他租户使用。 此功能暂未对外开放,如需使用,需提交工单申请。 支持删除资产。 数字人名片 支持为分身数字人制作形象名片。通过名片可以查看数字人形象和说话效果。 照片数字人 支持通过静态的人脸照片生成视频。 SP用户 MetaStudio支持SP模式,此模式对大客户开放,用于
数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。 单击热词后面的问号图标,在提示框中单击“查看教程”,可以查看配置视频。 如果开启热词配置,需要同时配置下述参数: SIS服务授权:SIS服务用于将用户口述音频转换为文本,需要开启授权。 详细操作如下所示:
MetaStudio FullAccess策略内容 MetaStudio ReadOnlyAccess MetaStudio只读权限,拥有该权限的用户仅能查看MetaStudio数据。 系统策略 MetaStudio ReadOnlyAccess策略内容 相关链接 IAM产品介绍 创建用户组、用
是现有真人信息沟通传播的补充与增强。 适用于不太注重人物表现力,借助口述传达信息内容的场景,比如产品介绍、功能教学、新闻报道、种草安利、网络直播、知识讲解、引导答疑等。 对于视频制作,有时间、人力、成本烦恼的都可以体验,万兴播爆数字人可以成为新的解决方案之一。 最近几年,国内电
仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。 取值范围: 字符长度1-2048位。 默认取值: 不涉及。 video_cover_url 否 String 参数解释: 视频封面文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。
高品质 制作声音模型 准备好音频文件后,就可以上传至MetaStudio控制台,进行声音训练。详细操作如下所示: 创建声音制作任务(自研模型) 查看声音 声音模型制作耗时,如下所示: 基础版:约1~3个工作日。 进阶版:约1~3个工作日。 高品质:约5个工作日。 自定义声音应用方式,如下所示:
false:不自动生成封面。 默认取值: false asset_order 否 Integer 参数解释: 用于console控制台展示顺序。 如果取值相同,则默认最新的排在前面。 约束限制: 不涉及 默认取值: 不涉及 取值范围: 0-32767 supported_service 否 Array
<word></word>标签用于设置选中文字为连读模式。 MetaStudio包含多种TTS音色,每种音色支持的SSML标签能力是有差异的,请通过“查询资产详情”接口,获取每个音色支持使用的标签。 speak标签 描述 <speak></speak>:SSML文本的根节点。 语法 1 <s