检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
)视频时,Chrome等浏览器将无法播放H265(HEVC)视频,并获取不到视频分辨率等参数。 在Chrome浏览器中输入“chrome://gpu”后,搜索“coding”。可以检查当前PC的浏览器是否支持H265(HEVC)视频解码。 图2 查看浏览器配置 用ffmpeg检查
授权浏览器麦克风的访问权限 支持对Chrome浏览器和Mac系统的浏览器,授权麦克风的访问权限。 谷歌浏览器 打开Chrome浏览器,单击浏览器右上方的图标,从下拉框中选择“设置”。 进入“设置”页面。 在左侧导航栏中,选择“隐私设置和安全性”。 在右侧界面中,单击“网络设置”,进入“网络设置”页面。
用户与数字人进行智能交互的URL页面,默认为IP地址形式。如果用户希望通过域名访问,目前MetaStudio服务提供了A记录的域名,但是这些A记录域名不能在浏览器直接访问,需要用户自己申请备案一个域名,并通过CNAME方式解析到如下域名上。 华东-上海一:metastudio-client.cn-east-3
支持通过问答库导入富媒体,示例如表1所示。以奇妙问知识库为例,可以通过新增知识库来补充富媒体知识。 如果使用服务提供SDK默认样式,受限于浏览器的CSP策略,导入图片、视频链接的域名,需提交工单添加至白名单。 表1 问答知识库 序号 标准问题 问题答案 1 如何领券? <img src="https:///test
声音和形象制作 标准版数字人可以用实景拍摄吗? 分身数字人定制任务提交后,审核未通过怎么办? 模型审核和制作可以加快吗? 部分浏览器提交H265训练视频失败如何处理? 声音和形象模型支持在其他平台使用吗? 声音和形象模型和音视频内容的关系? Flexus数字人在走动录制时需要注意什么?
操作前提 前提条件 需要申请开通智能交互权限后,才可集成智能交互SDK使用。 WebSDK使用限制 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 父主题: 智能交互客户端SDK
前提条件 需要申请开通智能交互权限后,才可以使用分身数字人智能交互功能。 智能交互对硬件设备的最低配置要求,如智能交互使用限制所示。 与数字人智能交互的界面,对浏览器的要求,如智能交互使用限制所示。 父主题: 智能交互
您需要进行账户充值。 开通MetaStudio服务:单击进入MetaStudio控制台,根据开通引导完成服务开通。 推荐浏览器 推荐使用Chrome浏览器访问MetaStudio控制台。
我们仅在实现本声明所述目的所必需的时间内保留您的个人信息,并在超出下述保留时间后删除或匿名化处理您的个人信息,除非法律法规另有要求。 用于智能交互获取的您的音频数据或文本数据,将在进行中的智能交互任务结束后删除。 用于产品运营和维护收集的应用信息(浏览器User Agent)、SDK接口调用记录,将保存一(1)个月后删除。
非三方驱动场景(是否支持) activeInteractionMode 获取当前生效的交互模式(语音问答/文本问答)。 × √ addEventListeners 回调注册。 √ √ checkBrowserSupport 检查浏览器是否支持。 √ √ create 创建交互任务。 √ √ destroy
Edge浏览器 80+ Android 移动版Chrome浏览器 91+ iOS 移动版Safari浏览器 17.3+ Mac Safari浏览器 15.6+ 表3 透明背景支持情况 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器 94+ Edge浏览器 94+
如果华为云账号无法满足用户的使用诉求,可参考创建用户并授权使用MetaStudio,创建IAM用户,进行精细化的权限管理。 推荐浏览器 推荐使用Chrome浏览器访问MetaStudio控制台。
使用目的 获取麦克风权限 获取浏览器的麦克风设备权限 开始语音交互时,用于进行语音识别文字,获取交互答案 四、延迟初始化要求 为了避免您的应用在未获取用户的同意前SDK提前处理用户的个人信息。我们提供了智能交互任务创建接口create,请保证您的应用获取用户同意后才能调用此接口初始化SDK。
在视频制作界面,如果添加视频,且视频格式为FLV、3GP、WMV、AVI时,无法展示视频播放效果,仅能图片展示。这是浏览器不兼容导致的,但是不影响视频合成效果。视频合成后,这些插入的视频可以正常播放和展示。 插入的视频素材,要求如下所示: 分辨率最大支持1080P。 帧率小于等于30fps。
创建一次性鉴权码 功能介绍 该接口用于创建一次性鉴权码,有效期5分钟,鉴权码只能使用一次,每次使用后需要重新获取。 接口只能通过第三方后台调用,不能在浏览器前台直接调用,否则会有跨域问题。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/once-code
的页面的行为。 浏览器通过有上述点击的行为,才能获取采集声音的权限。否则无法采集声音,无法正常使用语音唤醒能力。 浏览器使用限制,请参见表1。 表1 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器 91+ Edge浏览器 91+ Android
Edge浏览器 80+ Android 移动版Chrome浏览器 91+ iOS 移动版Safari浏览器 17.3+ Mac Safari浏览器 15.6+ 表3 透明背景支持情况 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器 94+ Edge浏览器 94+
无需设置,当前直播间保存后自动展示。 上述操作完成后,需要单击界面右上角的图标,保存直播内容。 单击界面右下方的“准备开播”,弹出“风险提示”对话框,如图12所示。 用户需要参照风险提示项,逐一核查并优化直播内容。 图12 风险提示 用户可以等直播风险消除后再开播,也可以直接选择“承担风险开播”后,等待直播启动。
开播后会直接播放音频,声音是音频原有声音。用户也可以设置主播和助播的声音,用于开播后,使用主播或助播声音,播报发送的互动内容。 图4 音频驱动 音频上传完成后,单击“试听”,可试听音频。 开播后可单击如图5所示的图标,切换到全局主播或助播的声音,发送互动内容成功后,播报互动内容。 图5 开播页面 即兴直播 无需设
接口参考 主入口(HwICSUiSdk) 事件通知(EventMap) 错误码(ICSError) 授权浏览器麦克风的访问权限 Web语音唤醒 父主题: Web SDK