检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Flexus数字人在走动录制时需要注意什么? 如果数字人形象采集时,面向镜头有行走、倒退或抛接物体等行为,建议数字人视频输出时长不超过2分钟,否则可能会因为MetaStudio动作循环逻辑,导致视频效果不佳。 父主题: 声音和形象制作
脸表情和人体姿态,转换为表情基系数及数字人骨骼驱动数据的一种技术。 其基本情况包括: 输入数据:单人表演视频。 算法原理:通过深度学习算法识别人脸表情和人体姿态,转换为表情基系数及数字人骨骼驱动数据。 输出结果:表情基系数、数字人骨骼驱动数据。 应用领域:应用于影视制作、虚拟人姿
照片建模任务出现异常问题怎么办? 若界面提示模型名重复 由于同一个账号下模型名称不可以重复,因此,您需要重新更换模型名称。 若界面提示照片太大 请您重新更换一个大小低于6MB照片。 父主题: 照片建模
如何自定义域名方式访问智能交互页面? 用户与数字人进行智能交互的URL页面,默认为IP地址形式。如果用户希望通过域名访问,目前MetaStudio服务提供了A记录的域名,但是这些A记录域名不能在浏览器直接访问,需要用户自己申请备案一个域名,并通过CNAME方式解析到如下域名上。 华
声音更新记录 2025年1月 表1 声音更新记录 发音人名称 性别 TTS版本 风格 语言 变更方式 云海 男 TTS V7 营销 中文 新增 云佳 女 TTS V7 客服 中文 新增 云辉 男 TTS V7 直播 中文 新增 云英 女 TTS V9 直播 中文 新增 云薇 女 TTS
分身数字人直播业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,防火墙需要放开如下限制: 解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。 表1 防火墙端口白名单
智能交互业务媒体流如何应对防火墙限制? 分身数字人智能交互业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,您的防火墙需要配置SparkRTC端口和域名的白名单,请参考直播业务媒体流如何应对防火墙限制?。 父主题: 智能交互
示。 图1 SDK默认方式展示效果 富媒体展示效果(自定义方式) 用户与数字人进行智能交互的页面,默认为用户需要自定义富媒体的展示效果,即用户自定义UI界面展示。 通过注册事件通知semanticRecognized获取回复文本,用户可以自行提取图片、视频标签进行自定义显示。 父主题:
修改说明 2025-01-14 本次变更如下: 新增发布3.0.2版本SDK,相比3.0.1版本,变更点如下所示: 语音唤醒能力支持设备切换实时生效。 2024-12-30 本次变更如下: 新增发布3.0.1版本SDK,相比2.2.0版本,变更点如下所示: 新增语音唤醒能力,详见Web语音唤醒。
2024-08-20 第十次正式发布 本次变更如下: 新增接口:查询任务操作日志。 2024-06-01 第九次正式发布 本次变更如下: 新增接口:批量资产操作。 新增接口组:直播商品管理。 2024-05-15 第八次正式发布 本次变更如下: 新增接口组:智能交互数字人知识库技能管理。
开启AM子账户隔离能力后,华为云账号可以在资产归属分配页面,修改所有资产的归属。 注意事项 开启AM子账户隔离能力后,各IAM子账户历史上传或制作的资产归属均已自动变更为华为云账号。 视频制作剧本、直播间、智能交互对话项目,暂不支持修改资产归属。 企业联邦虚拟用户,不支持修改资产归属。 操作步骤 登录MetaStudio控制台。
在左侧导航栏中,单击“任务中心”。 在“分身数字人”页签,单击数字人定制任务右侧的“查看详情”,进入“定制任务详情”页面。 审核通过后,任务状态变更为“算法训练中”,如图1所示。 单击右上角的“编辑”,可以为数字人添加标签。标签添加完成后,单击“保存”,保存修改。 图1 数字人定制任务
操作前提 前提条件 需要申请开通智能交互权限后,才可集成智能交互SDK使用。 WebSDK使用限制 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 父主题: 智能交互客户端SDK
MetaStudio服务支持自定义生成分身数字人。 操作前准备 用户创建分身数字人定制任务前,需要参考操作步骤准备如下内容: 5~6分钟绿幕拍摄视频。 注意:如果制作分身形象的时候,选择保留拍摄背景,则需要准备实景背景拍摄视频。 身份证正反面照片。 形象授权签署文件,如授权书所示。 操作步骤
图1 创建应用 表1 创建应用 参数 说明 第三方应用 选择“第三方语言模型”。 应用名称 输入自定义的应用名称。 APPID MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPID信息。 APPKEY MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPKEY信息。
创建应用:在科大讯飞的AIUI开放平台创建应用。 配置应用:应用需要使用AIUI通用语义模型,并启用创建技能中已创建的技能。 查看应用信息:在MetaStudio服务创建“科大讯飞AIUI通用语义模型”智能交互对话项目时,需要使用这里的应用信息,包括:应用名称、APPID、APPKEY和APISECRET。
智能交互 智能交互支持富媒体吗? 如何自定义域名方式访问智能交互页面? 智能交互业务媒体流如何应对防火墙限制? 智能交互界面报错“MSS.20010135”如何处理? 如何实时切换智能交互的语言和声音?
操作系统 Windows或Android系统。 麦克风 需要有麦克风,且要保障1米以内的拾音效果。 扬声器 需要有扬声器。 触摸屏 需要有触摸屏。 带宽 4M以上。 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。
et链接。 须知: 参数返回的地址默认无wss://前缀,实际使用时,需要补齐前缀。示例:如果返回字段内容为metastudio-api.cn-north-4.myhuaweicloud.com:443,则需要拼接为wss://metastudio-api.cn-north-4.myhuaweicloud
建议Webpack 5 + babel 7。 浏览器 浏览器使用限制,请参见表2。 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 表2 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器