检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何自定义域名方式访问智能交互页面? 用户与数字人进行智能交互的URL页面,默认为IP地址形式。如果用户希望通过域名访问,目前MetaStudio服务提供了A记录的域名,但是这些A记录域名不能在浏览器直接访问,需要用户自己申请备案一个域名,并通过CNAME方式解析到如下域名上。 华
分身数字人直播业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,防火墙需要放开如下限制: 解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。 表1 防火墙端口白名单
智能交互业务媒体流如何应对防火墙限制? 分身数字人智能交互业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,您的防火墙需要配置SparkRTC端口和域名的白名单,请参考直播业务媒体流如何应对防火墙限制?。 父主题: 智能交互
声音和形象制作 部分浏览器提交H265训练视频失败如何处理? Flexus数字人在走动录制时需要注意什么?
用户与数字人进行智能交互的页面,富媒体展示效果支持使用SDK提供的默认展示方式。 下述智能交互客户端SDK的两个方法的配置字段enableCaption,默认值均为False,即用户自定义富媒体的展示效果。如果需要使用SDK提供的默认展示效果,需修改参数enableCaption的值为true。
获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 X-Project-Id 否 String
智能交互 智能交互支持富媒体吗? 如何自定义域名方式访问智能交互页面? 智能交互业务媒体流如何应对防火墙限制? 如何实时切换智能交互的语言和声音?
退或抛接物体等行为,建议数字人视频输出时长不超过2分钟,否则可能会因为MetaStudio动作循环逻辑,导致视频效果不佳。 父主题: 声音和形象制作
建议Node 17+。 编译工具 建议Webpack 5 + babel 7。 浏览器 浏览器使用限制,请参见表2。 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 表2 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows
部分浏览器提交H265训练视频失败如何处理? 问题描述 制作分身形象时,上传的训练视频无法播放,或提交训练任务时,提示分辨率不符合要求,如下图所示。 图1 分身形象制作 问题原因 由于Chrome等浏览器只支持硬解码H265(HEVC)视频,当您的PC硬件不支持解码H265(HEVC)视频时,Chro
需要有扬声器。 触摸屏 需要有触摸屏。 带宽 4M以上。 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 智能交互界面对浏览器的要求,如表2所示。 表2 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows
数字内容生产线的计费价格调整公告 随着数字人业务的发展,数字人市场已发生变化。华为云数字内容生产线为更好的提供服务,将从2024年9月27日起,对中国大陆分身数字人形象制作、声音制作进阶版、视频制作的按需计费及按需预付费套餐包,进行统一调价。调整后的价格如表1所示。 表1 中国大陆价格调整详情
操作前提 前提条件 需要申请开通智能交互权限后,才可集成智能交互SDK使用。 WebSDK使用限制 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 父主题: 智能交互客户端SDK
根据唤醒词定制的唤醒模型,可以提升唤醒词的准确率。 能否直接在本地修改唤醒词? 不行。模型和唤醒词是绑定的,不支持本地修改唤醒词。 集成WebSDK的网页加载时自动调用create接口创建数字人,但是后续的数字人播报为啥没有声音? 原因请参考媒体和Web Audio API 的自动播放
服务支持的字体 MetaStudio制作视频添加的字幕,视频画面中的文本信息都涉及字体。目前MetaStudio服务支持的字体及语言类型如表1所示。 表1 服务支持的字体说明 字体名称 支持的语言类型 Adelle_Sans_Global Adelle_Sans_Global_Bold
如何接收并激活声音和分身模型资产? 管理员或其他租户如果推送声音或分身模型资产给当前租户,当前租户需在7天内完成接收和激活操作。如果超过7天未操作,需要管理员或其他用户重新推送资产给当前租户。 声音和分身模型资产的接收、激活操作均相同,下面以分身模型资产的接收、激活操作为例演示。
获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。
(密码和访问密钥)。 在我的凭证下,您可以查看账号ID和用户ID。通常在调用API的鉴权过程中,您需要用到账号、用户和密码等信息。 区域 指云资源所在的物理位置,同一区域内可用区间内网互通,不同区域间内网不互通。通过在不同地区创建云资源,可以将应用程序设计的更接近特定客户的要求,或满足不同地区的法律或其他要求。
文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。
对于管理员创建IAM用户接口,您可以从接口的请求部分看到所需的请求参数及参数说明,将消息体加入后的请求如下所示,其中加粗的字段需要根据实际值填写。 accountid为IAM用户所属的账号ID。 username为要创建的IAM用户名。 email为IAM用户的邮箱。 **********为IAM用户的登录密码。