检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
互动内容。 图5 开播页面 即兴直播 无需设置剧本,直接开播,界面如图6所示。开播后数字人保持静默,需要发送互动内容或者通过真人接管,驱动数字人说话。 图6 即兴直播 如果还需要制作多场景,可以单击直播画面预览窗口右侧“场景1”小窗口下方的“+”图标,新增场景,并参考前一个场景,
获取语音驱动表情数据 功能介绍 该接口用于获取生成的数字人表情驱动数据 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/fas-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户项目ID
定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备完成如下内容: “语料上传”方式制作声音时,需要参考声音制作页面的“录音指导”录制音频。 签署声音授权文件,如授权书所示。 购买小语种克隆套餐包并激活使用,操作请参考购买出门问问声音套餐。
使用限制 在使用数字内容生产线服务前,您需要了解本服务的使用限制信息。 区域限制 预置模特使用限制 API使用限制 形象制作限制 声音制作限制 视频制作限制 视频直播限制 Flexus分身数字人限制 照片数字人限制 智能交互限制 资产管理说明 SP用户限制
为了保证数字人训练的效果,请按照我们提供的流程进行录制,请根据实际需求评估录制流程: 不需要交互:15~20秒静默 + 4~5分钟自然表达 需要交互:15~20秒静默 + 无语义动作 + 4~5分钟自然表达,详见交互数字人拍摄要求。 需要动作编排:15~20秒静默 + 4~5分钟自然表达 + 单独拍摄动
肢体驱动数据格式如何定义? MetaStudio肢体驱动数据的前三个为Hips骨骼的Translation信息,按XYZ排列,后接75根骨骼的旋转数据,具体定义如下: 序号 骨骼名称 0 Hips 1 Spine 2 Spine1 3 Spine2 4 Spine3 5 Neck
资产存储计费说明 资产存储 计费说明 免费存储空间 MetaStudio服务免费赠送每个租户5GB资产存储空间,用于上传各类音视频、图片等素材。如果租户需要更多的存储空间,请购买单独的资产管理包月产品。 定制形象模型存储 基于MetaStudio服务定制生成的形象模型,其所包含的音色模型所占存储空间,暂不计入租户资产存储计费中。
界面详情请参见图3。 委托站点 从下拉框中选择用户购买CBS服务的问答机器人所在Region。 委托 需要授予MetaStudio服务CBS服务的访问权限。 首次委托的站点,需要开启委托开关。详细操作如下所示: 开启委托开关,界面会弹出如图3所示的对话框。 单击“同意授权”,Me
示方式。 下述智能交互客户端SDK的两个方法的配置字段enableCaption,默认值均为False,即用户自定义富媒体的展示效果。如果需要使用SDK提供的默认展示效果,需修改参数enableCaption的值为true。 修改create方法中param参数的config配置
文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考购买出门问问声音套餐。 请填写名片信息 姓名 必填项,数字人姓名。
strings 音频上传的地址。 说明: 通过该obs地址上传时需要设置content-type为audio/wav txt_uploading_url Array of strings 文本上传的地址。 说明: 通过该obs地址上传时需要设置content-type为text/plain 表4
SDK静态JS文件,则通过以下方式访问: import { HwICSUiSdk } from './sdk/HwICSUiSdk' 除以上JS文件引入之外,还需要引入CSS样式文件,可以直接通过link标签引入或者直接在项目中import: <link rel="stylesheet" href="
新增商品中新增的商品会自动展示在“商品”页签中,可直接使用。 直播画面创作完成后,需要制作剧本。 服务有预置文本,可以直接使用,如图8所示。用户也可以根据实际场景自定义文本内容,并单击图标,新增段落。 图8 文本驱动 如果还需要制作多场景,可以单击直播画面预览窗口右侧“场景1”小窗口下方的“+”
除了电商平台不断压缩商家的利润空间之外,跨境营销还面临着语言、文化等多重问题,这导致了高昂的成本,尤其是在获取流量方面。 特别是对于那些需要进行营销推广的视频,因为要面向国外用户,通常需要使用外国模特。 商家需要尽量与目标观众熟悉的形象接轨,以提高观众的信任度。 换句话说,为了更好地触达海外消费者,必须聘请外籍模
节。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“资源”页签,如图1所示。 图1 资源页面 如果需要删除已激活的资产,可以通过下述2种方式删除。 方式一:单击资产卡片中的“取消激活”。取消激活成功后,在“未激活”页签中,单击卡片中的图标,从下拉框中选择“删除”,删除资产。
自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音。文本驱动需要填写introduction_text和voice_asset_id参数。 AUDIO: 语音驱动,需要在资产库中先上传语音资产。语音驱动需要填写introduction_audio_asset_id参数。 默认取值:
单击“定制数字人”,可以定制自己需要的数字人形象。 用户自定义的Flexus分身数字人,也会展示在这里。Flexus分身数字人左上角会有标识。 背景:背景图片列表,可本地导入图片。支持透明背景、纯色背景或导入图片。 PPT:PPT文件列表,需要用户从本地导入后使用。 贴图:各类
et链接。 须知: 参数返回的地址默认无wss://前缀,实际使用时,需要补齐前缀。示例:如果返回字段内容为metastudio-api.cn-north-4.myhuaweicloud.com:443,则需要拼接为wss://metastudio-api.cn-north-4.myhuaweicloud
自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音。文本驱动需要填写introduction_text和voice_asset_id参数。 AUDIO: 语音驱动,需要在资产库中先上传语音资产。语音驱动需要填写introduction_audio_asset_id参数。 默认取值:
表情驱动数据格式如何定义? MetaStudio表情驱动的表情基数据总共52个系数,每个系数的取值范围在0~1之间,表情基系数的顺序性定义如下: 序号 表情名称 0 mouthPucker 1 mouthPressLeft 2 mouthPressRight 3 mouthRollUpper