检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
分身视频直播首页面的“商品管理”页签,支持新增商品。商品会自动展示在直播间的“商品”页签中,供直播间添加使用。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“商品管理”,进入如图1所示的页面。 图1 商品管理页面 单击“新建”,进入“创建商品”页面,如图2所示。
成失败的任务。 在下方的名片列表中,可以查看名片详情,包括名片封面、名称、任务ID、提交时间、生成时间、状态等信息。 支持对名片进行如下操作: 单击“查看”,进入“我的创作 > 分身名片”页面,可以查看名片详情,如查看名片所示。 单击“下载”,将名片下载至本地查看。下载后的文件为mp4格式。
完整性校验 操作说明 对下载的SDK安装包进行完整性校验,判断下载过程是否存在篡改和丢包现象。 操作步骤 参考下载SDK安装包,下载SDK安装包至本地。 打开本地命令运行程序,输入如下命令,在本地生成SDK安装包的SHA256值。 其中,“D:\HwICSUiSdk-1.0.0.
常用概念 数字人 数字人是一种以数字形式存在于数字空间中的虚拟人物,它具有拟人或真人的外貌、行为特点,并具备一定的智能和情感,可以进行交互和表达。数字人也可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。
设置完成后,单击“生成视频”,弹出如图2所示的对话框,显示照片数字人视频的生成进度。 可执行下述操作: 单击图中第一个链接“任务中心-视频”,可进入“任务中心 > 照片数字人”页面,查看任务进度,详情请参见查看任务。 单击图中第二个链接“我的创作-视频”,可进入“我的创作 > 视频”界面,查看已生成的视频,详情请参见查看视频。
在左侧导航栏中,单击“我的创作”。 选择“声音”页签,单击界面右侧的“特殊词表”,进入如图1所示的界面。 图1 特殊词表 单击“新建词表”,界面新增一行特殊词,如图2所示。 在“原始词”列输入原始内容。 在“新建读法”列,输入拼音后,从下拉框中选择正确的读音。如有多个字,需单击“+”号图标,依次输入各文字的拼音。
方法请参见如何调用API。 终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,MetaStudio的终端节点如表1所示。您也可以从地区和终端节点中查询服务的终端节点。 表1 MetaStudio的终端节点 区域名称 区域 终端节点(Endpoint) 华东-上海一
分身视频直播首页面,如图1所示。各个页签的说明,如下所示: 直播管理:使用数字人创建直播间。操作请参考视频直播。 互动管理:支持新增互动库,及其相应的互动规则。互动库可以直接在直播间中导入使用。操作请参考互动管理。 商品管理:支持新增商品。商品会自动展示在直播间的“商品”页签中,供直播间添加使用。操作请参考商品管理。
文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。
返回该状态码,表明客户端尝试创建的资源已经存在,或者由于冲突请求的更新操作不能被完成。 500 Internal Server Error 表明服务端能被请求访问到,但是不能理解用户的请求。 501 Not Implemented 服务器不支持请求的功能,无法完成请求。 502 Bad
number 识别流式响应时返回的各包顺序序号。 isLast boolean 是否是最后一条识别结果。 chatId string 对话ID,每轮问答的ID值唯一。 speechRecognized通知的流式返回跟semanticRecognized是有差异的,详细见:speechRe
用户与数字人进行智能交互的页面,富媒体展示效果支持使用SDK提供的默认展示方式。 下述智能交互客户端SDK的两个方法的配置字段enableCaption,默认值均为False,即用户自定义富媒体的展示效果。如果需要使用SDK提供的默认展示效果,需修改参数enableCaption的值为true。
返回结果 状态码 请求发送以后,您会收到响应,其中包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于管理员创建IAM用户接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对
初始化语音唤醒资源,不使用语音唤醒能力则忽略该接口。 3.0.1之后的websdk包里面有如下两个资源文件,如果不使用语音唤醒,可忽略这两个文件。 wasmData.js:语音唤醒的算法资源文件。 modelData.js:语音唤醒的模型资源文件。 SDK内置默认唤醒模型,支持定制唤醒词,并更新本地模型,详见Web语音唤醒。
授权书 分身形象或声音定制的授权书,如中文授权书和英文授权书所示。 父主题: 附录
etaStudio控制台,根据开通引导完成服务开通。 IAM权限管理 如果华为云账号无法满足用户的使用诉求,可参考创建用户并授权使用MetaStudio,创建IAM用户,进行精细化的权限管理。 推荐浏览器 推荐使用Chrome浏览器访问MetaStudio控制台。
MetaStudio服务对租户资产内容的风险有一定连带责任。如果服务接收到资产内容投诉,按照国家相关部门要求,会冻结违规违规资产。情节严重的,还会冻结租户的全部资源。 被冻结的资产不能用作内容生成的素材。租户可以删除被冻结的资产或者申请解冻资产。 用户申请解冻资产 用户可以通过申诉的方式,申请解冻资产,解冻后资产会恢复至解冻前的状态。
在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“互动管理”,进入如图3所示的页面。 图3 互动管理页面 在左侧“互动库”区域,单击下方的“新增互动库”,上方新增一条横线,如图4所示。 输入互动库的名称。 图4 互动库 选中左侧的互动库,单击界面右侧的“新建”,弹出“新建互动”对话框,如图5所示。
角色名称 输入分身数字人的角色名称。 示例:云笙。 训练视频 从本地上传已录制好,且符合拍摄要求的人像视频。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄。支持MP4、MOV格式的视频。 背景替换 选择“
解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。 表1 防火墙端口白名单 端口类型 端口 TCP端口 443、6447 UDP端口 20000-20063 配置SparkRTC域名的防火墙白名单,如表2所示。