检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
系统资产标签定义 查询资产列表接口支持使用“tags”标签对分身数字人模型进行分类。 “tags”取值及其含义,如表1所示。 表1 tags标签说明 tags取值类型 说明 数字人类型 取值如下: VIRTUAL_AVATARS:分身数字人 VIRTUAL_HUMANS:虚拟数字人
预置音色ID列表 系统预置自研音色ID列表,如表1所示。 表1 预置音色ID列表 音色名称(中文) 资产ID(华东-上海一) 资产ID(华北-北京四) 音色名称(英文) 资产ID(亚太-新加坡) 云歌 075494c45b5aef529d55cd2a456e6076 0a4b54
需要确认这里的“设备”与Windows系统的声音输出设备是否一致。如果不一致,会导致OBS无法成功捕获声音给第三方直播平台。需要修改为一致后再直播。 图2 桌面音频属性设置 检查Windows系统的声音输出设备 在Windows系统的系统设置中,找到声音设置,查看输出设备,示例如图3所示。
智能交互对硬件设备的最低配置要求,如表1所示。 表1 硬件设备要求 硬盘配置 最低配置 CPU i5及以上版本。 内存 8G以上。 硬盘 128G及以上。 操作系统 Windows或Android系统。 麦克风 需要有麦克风,且要保障1米以内的拾音效果。 扬声器 需要有扬声器。 触摸屏 需要有触摸屏。
最新动态 本文介绍了数字内容生产线 MetaStudio各特性版本的功能发布和对应的文档动态,新特性将在各个区域(Region)陆续发布,欢迎体验。 2022年12月 序号 功能名称 功能描述 阶段 相关文档 1 数字内容生产线服务上线(受限公测) MetaStudio依托图形引
询问是否可以使用您的麦克风或摄像头,允许使用即可。 Mac系统的浏览器 在Mac程序坞中,单击“系统偏好设置”图标,打开“系统偏好设置”界面。 单击“安全性与隐私”图标,如图1所示。进入“安全性与隐私”界面。 图1 系统偏好设置 选择“隐私”页签。在左侧目录树中,单击“麦克风”,如图2所示。
由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 表2 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器 91+ Edge浏览器 80+ Android 移动版Chrome浏览器 91+ Ios
码方式登录。 图1 奇妙问 单击“登录”,进入奇妙问“创建角色”页面,如图2所示。 界面右侧有“创建角色”入口,下方的“角色中心”区域展示系统预置的角色,可以直接克隆使用。 图2 创建角色 单击“创建角色”,进入“创建角色”页面,如图3所示。 参数配置说明,如表1所示。 图3 创建角色
String 参数解释: 操作。 约束限制: 系统属性仅为系统设置,普通用户无法修改。 取值范围: ADD:增加 DELETE:删除 默认取值: 不涉及 key 否 String 参数解释: 系统属性条目。 约束限制: 系统属性仅为系统设置,普通用户无法修改。 取值范围: 公共资产属性:
String 参数解释: 操作。 约束限制: 系统属性仅为系统设置,普通用户无法修改。 取值范围: ADD:增加 DELETE:删除 默认取值: 不涉及 key 否 String 参数解释: 系统属性条目。 约束限制: 系统属性仅为系统设置,普通用户无法修改。 取值范围: 公共资产属性:
客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。 进阶版:整段录制生成一个WAV或MP3格
视频直播 用户可以使用分身数字人,创建直播间。 操作前准备 如果系统预置的数字人形象不满足要求,请参考形象制作,提前定制符合要求的分身数字人形象。 推荐使用Chrome浏览器访问MetaStudio控制台。 操作限制 MetaStudio控制台预置形象的有效使用期为3年,在202
String 参数解释: 操作。 约束限制: 系统属性仅为系统设置,普通用户无法修改。 取值范围: ADD:增加 DELETE:删除 默认取值: 不涉及 key String 参数解释: 系统属性条目。 约束限制: 系统属性仅为系统设置,普通用户无法修改。 取值范围: 公共资产属性:
作”,详见计费说明。 系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问语音合成套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明。 系统声音免费使用。第三方声音
String 参数解释: 操作。 约束限制: 系统属性仅为系统设置,普通用户无法修改。 取值范围: ADD:增加 DELETE:删除 默认取值: 不涉及 key String 参数解释: 系统属性条目。 约束限制: 系统属性仅为系统设置,普通用户无法修改。 取值范围: 公共资产属性:
Markup Language)来控制数字人的行为,包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。MetaStudio在此基础上,扩展了一些字段用于实现数字人的控制。 MetaStudio SSML当前支持如下能力: TTS语音合成时,控制文字读音。
它不仅拥有出色的功能,还具备卓越的性能。 让您可以轻松体验畅快无比的运行速度和极致的使用感受。 这款家用机器人具备稳定的电力供应和支持系统。 这款家用机器人还具备精细化的动作控制与执行能力。 无论是行走、搬运物品还是执行其他动作,机器人都能轻松应对。 这款家用机器人还采用了超
hub.com/BtbN/FFmpeg-Builds/releases。 ffmpeg解压后,将其下bin目录加入系统环境变量。 输入命令行ffmpeg后可以显示版本号,说明安装成功。 解决方法 通过剪映或者ffmpeg可以将H265(HEVC)视频的格式转码为H264,再上传至
购买出门问问声音套餐 购买出门问问声音套餐, 详见购买出门问问语音合成套餐的操作流程。 购买出门问问语音合成套餐的操作流程 如需使用系统预置的第三方声音,需要购买出门问问语音合成套餐包,详细的操作流程如下所示。第三方声音支持的语言类型,如第三方声音支持的语言类型所示。 购买出门问
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"