检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何自定义域名方式访问智能交互页面? 用户与数字人进行智能交互的URL页面,默认为IP地址形式。如果用户希望通过域名访问,目前MetaStudio服务提供了A记录的域名,但是这些A记录域名不能在浏览器直接访问,需要用户自己申请备案一个域名,并通过CNAME方式解析到如下域名上。 华
智能交互业务媒体流如何应对防火墙限制? 分身数字人智能交互业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,您的防火墙需要配置SparkRTC端口和域名的白名单,请参考直播业务媒体流如何应对防火墙限制?。 父主题: 智能交互
分身数字人直播业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,防火墙需要放开如下限制: 解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。 表1 防火墙端口白名单
通过API上传的视频和图片素材,为啥视频制作时不可见? 通过API上传的图片和视频,如果在视频制作时不可见,是因为上传资产时未设置system_properties属性,如下所示: 资产类型是IMAGE时,通过system_properties来区分背景图片(BACKGROUND
声音和形象模型和音视频内容的关系? 声音制作、形象制作和Flexus形象制作得到的模型为模型资产,需要通过视频制作、视频直播和智能交互生成音视频内容,详见功能特性。 声音制作:录制真人声音,建模生成声音模型。 形象制作:拍摄形象采集视频,建模生成数字人形象。 视频制作:使用系统预
声音和形象制作 标准版数字人可以用实景拍摄吗? 分身数字人定制任务提交后,审核未通过怎么办? 模型审核和制作可以加快吗? 部分浏览器提交H265训练视频失败如何处理? 声音和形象模型支持在其他平台使用吗? 声音和形象模型和音视频内容的关系? Flexus数字人在走动录制时需要注意什么?
用户与数字人进行智能交互的页面,富媒体展示效果支持使用SDK提供的默认展示方式。 下述智能交互客户端SDK的两个方法的配置字段enableCaption,默认值均为False,即用户自定义富媒体的展示效果。如果需要使用SDK提供的默认展示效果,需修改参数enableCaption的值为true。
API和SDK使用 如何获取项目ID? 如何调用MetaStudio接口? Flexus支持通过API集成使用吗? 为什么调用API时提示“APIG.0301”? 使用API时返回“APIGW”开头的错误码,该如何处理? 智能交互SDK从哪里下载? 通过API合成的视频封面为什么看不到插入的视频素材缩略图?
模型审核和制作可以加快吗? 为了保证模型质量,确保素材符合拍摄要求,训练前素材会经过人工审核。原则上不支持催审和加速,请耐心等待。模型审核制作耗时详情,如表1所示。 表1 模型制作耗时 模型类型 制作耗时 声音模型 声音模型制作耗时,如下所示: 基础版:约1~3个工作日。 进阶版:约1~3个工作日。
智能交互 智能交互支持富媒体吗? 如何自定义域名方式访问智能交互页面? 智能交互业务媒体流如何应对防火墙限制? 智能交互界面报错“MSS.20010135”如何处理? 如何实时切换智能交互的语言和声音?
使用API时返回“APIGW”开头的错误码,该如何处理? 当您使用云服务API,遇到“APIGW”开头的错误码,请参考错误码说明进行处理。 父主题: API和SDK使用
需要有扬声器。 触摸屏 需要有触摸屏。 带宽 4M以上。 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 智能交互界面对浏览器的要求,如表2所示。 表2 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows
操作前提 前提条件 需要申请开通智能交互权限后,才可集成智能交互SDK使用。 WebSDK使用限制 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 父主题: 智能交互客户端SDK
建议Node 17+。 编译工具 建议Webpack 5 + babel 7。 浏览器 浏览器使用限制,请参见表2。 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 表2 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows
通过API合成的视频封面为什么看不到插入的视频素材缩略图? 通过API合成的视频封面,如果看不到插入的视频素材缩略图,是因为创建分身数字人视频制作任务接口未配置image_config参数。详细说明如下所示: 使用创建分身数字人视频制作任务接口插入视频素材时,“layer_typ
根据唤醒词定制的唤醒模型,可以提升唤醒词的准确率。 能否直接在本地修改唤醒词? 不行。模型和唤醒词是绑定的,不支持本地修改唤醒词。 集成WebSDK的网页加载时自动调用create接口创建数字人,但是后续的数字人播报为啥没有声音? 原因请参考媒体和Web Audio API 的自动播放
SP用户可以将购买的资源分配给多个租户使用。分配资源前,需先参考本节,关联所有租户。 前提条件 关联租户已注册华为账号:单击进入注册页面。 关联租户已完成实名认证:单击进入实名认证。 关联租户提供项目ID给SP用户,获取项目ID的方法请参见获取项目ID。 关联租户提供的项目ID对应R
(密码和访问密钥)。 在我的凭证下,您可以查看账号ID和用户ID。通常在调用API的鉴权过程中,您需要用到账号、用户和密码等信息。 区域 指云资源所在的物理位置,同一区域内可用区间内网互通,不同区域间内网不互通。通过在不同地区创建云资源,可以将应用程序设计的更接近特定客户的要求,或满足不同地区的法律或其他要求。
文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。
操作前提 注册操作 注册华为账号:单击进入注册页面。 完成实名认证:单击进入实名认证。 账户充值:为确保正常使用MetaStudio,您需要进行账户充值。 开通MetaStudio服务:单击进入MetaStudio控制台,根据开通引导完成服务开通。 推荐浏览器 推荐使用Chrom