检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如果合成视频的费用使用一次性计费,那么额度用尽后,需重新购买使用。 如果合成视频的费用使用按需预付费套餐包抵扣,额度使用完后,转按需付费。 须知: Flexus数字人视频制作时,必须使用flexus形象;声音可以使用flexus声音或标准版声音。标准版视频制作,不支持使用flexus形象或声音。
话习惯录制。 拍摄流程 支持手机或相机拍摄,需1080P或更高分辨率。 录制时长为2分钟,包含15秒静默转态和1分45秒的演讲过程。 允许使用中文、英文录制。 录制全程眼睛需注视镜头,周围环境保持安静,脸部光照明亮且均匀。 拍摄完成后不要剪辑,整个视频一起上传至MetaStudio控制台。
视频界面详情,如图6所示。 上传后的视频不支持修改。如需修改视频内容,需本地修改完成后,再上传至控制台使用。 插入的视频不支持单独调节宽或高,仅支持宽高等比例缩放。如需调节视频的宽和高,请本地调整好后再导入至平台使用。 图6 视频界面 视频界面说明,如表5所示。 表5 界面元素说明 界面元素 说明 本地导入
触发时长:设置通用安抚话术的触发时间,在这时间之前如果答案未生成,则播报此安抚话术。 高级设置:根据意图自定义安抚话术。默认不开放,如需使用,请提交工单申请开通,并提供需要使用的第三方应用名称。 单击“添加意图及话术”,新增“意图1”配置框。 需配置下述参数: 意图1:从下拉框中选择意图,这里展
们将通过本声明向您说明我们如何收集、使用、披露、保护、存储及传输您的个人信息。 请注意:我们要求集成数字人智能交互Web SDK的所有客户严格遵循法律法规、客户协议和数字人智能交互Web SDK合规使用指南的要求处理您的个人信息;在接入、使用各开放能力前,我们要求客户在其产品应用
录音环境 录音文案 基础版 优先使用专业录音设备录制音频,推荐使用Adobe Audition软件进行录音。 如果不具备专业录音设备,可使用手机录制音频,详情请参见手机录制音频。 录音环境安静,无回音、混响、噪声,避免出现汽车鸣笛、他人说话、走动等杂声。 可使用“分贝仪”应用来测试录音环境的底噪,建议底噪低于0dB。
quality)”。 返回至录音页面,开始录制。 采样位 推荐使用48bit采样位录制音频。 苹果手机的简易录音机的采集位默认为16bit,无需修改。 声道 推荐使用单声道录制音频。 苹果手机的简易录音机默认为单声道录制,无需修改。 音频格式 推荐使用无损音质格式保存音频,如WAV、MP3格式。 音频命名
家用机器人,是一款集合了众多顶尖科技的全新智能设备。 它不仅拥有出色的功能,还具备卓越的性能。 让您可以轻松体验畅快无比的运行速度和极致的使用感受。 这款家用机器人具备稳定的电力供应和支持系统。 这款家用机器人还具备精细化的动作控制与执行能力。 无论是行走、搬运物品还是执行其他动作,机器人都能轻松应对。
视频界面详情,如图4所示。 上传后的视频不支持修改。如需修改视频内容,需本地修改完成后,再上传至控制台使用。 插入的视频不支持单独调节宽或高,仅支持宽高等比例缩放。如需调节视频的宽和高,请本地调整好后再导入至平台使用。 图4 视频界面 视频界面说明,如表4所示。 表4 界面元素说明 界面元素 说明 本地导入
在调用create接口之前,必须要有用户点击集成WebSDK的页面的行为。 浏览器通过有上述点击的行为,才能获取采集声音的权限。否则无法采集声音,无法正常使用语音唤醒能力。 浏览器使用限制,请参见表1。 表1 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器 91+ Edge浏览器
声音模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 视频制作 使用系统预置或自定义生成的数字人形象、声音,制作音视频内容。 制作的视频可应用于教学、培训等各类场景中。 视频直播 使用系统预置或自定义的数字人形象、声音,制作音视频直播内容。 可通过下述方式,在直播平台开播。
此接口,实现智能交互能力。 流式响应 MetaStudio智能交互提供流式问答和非流式问答能力,其中流式问答响应更快。开启后使用流式问答能力, 关闭则使用非流式问答能力。 多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。 配置说明,如下所示: 如
用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。
资源激活后,从激活日期开始计算,有效期是一年。这里选择的日期,为有效期内的时间。 这里配置的日期,为当前租户使用已分配资源的截止日期。到达此日期后,资源自动释放回原有资源包中,SP用户可再次分配给租户使用。 单击“确定”,界面右上角提示“分配资源成功”。 在“租户列表”页面,可以查看分配效果,如图4所示。
用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。
这里的声音合成,仅针对使用声音API调用,通过MetaStudio控制台声音制作方式生成的声音,来合成音频的费用。 如需使用此功能,需单击“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。 如需查看声音合成的使用量,单击左下角的“已使用量”,跳转
快速入门 环境要求 Web SDK运行环境要求,如表1所示。 表1 环境要求 环境项 使用限制 开发工具 Microsoft Visual Studio Code、WebStorm或其他Web IDE开发工具。 语言 Javascript或Typescript。 编译环境 建议Node
也可以复制数字人互动页面的网址,分享给其他用户使用。 获取数字人互动页面URL的方式还有:进入“我的创作 > 智能交互 > 对话项目”页面,单击智能交互对话项目右侧的“复制URL和激活码”,可以将URL和激活码分享给其他用户使用。 详细操作如下所示: 复制URL至浏览器中,进入“智能交互激活”页面。
用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。
所有问答对录入完成后,单击“导出”,将技能文件下载至本地,待后续使用。 也可以使用下述方式,导出技能文件。 所有问答录入完成后,单击左上方的“返回”,回到“智能交互 > 技能管理”页面。 单击技能右侧的“导出”,如图5所示。 将技能文件下载至本地,待后续使用。 图5 导出技能 在科大讯飞创建同名技能并导入技能文件