检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
购买出门问问声音套餐 购买出门问问声音套餐, 详见购买出门问问语音合成套餐的操作流程。 购买出门问问语音合成套餐的操作流程 如需使用系统预置的第三方声音,需要购买出门问问语音合成套餐包,详细的操作流程如下所示。第三方声音支持的语言类型,如第三方声音支持的语言类型所示。 购买出门问
js文件集成websdk。 2025-01-14 本次变更如下: 新增发布3.0.2版本SDK,相比3.0.1版本,语音唤醒能力支持设备切换实时生效。 2024-12-30 本次变更如下: 新增发布3.0.1版本SDK,相比2.2.0版本,变更点如下所示: 新增语音唤醒能力,详见Web语音唤醒。 新增
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
strings 分身数字人训练任务标签。 model_version String 分身数字人模型版本。默认是V3.2版本模型。 V3.2:V3.2版本模型 说明: V3和V2版本已废弃不用 取值范围: 0-64 默认取值: V3.2 matting_type String 抠图类型。默认是AI。
为避免不好的体验,可以配置安抚话术,及时安抚用户情绪,耐心等待回复。 开启安抚话术后,可以看到“通用安抚话术”。系统预置30个话术,需要单击“添加话术”,一一添加系统话术,支持修改。 还需配置下述参数: 触发时长:设置通用安抚话术的触发时间,在这时间之前如果答案未生成,则播报此安抚话术。
strings 分身数字人训练任务标签。 model_version String 分身数字人模型版本。默认是V3.2版本模型。 V3.2:V3.2版本模型 说明: V3和V2版本已废弃不用 取值范围: 0-64 默认取值: V3.2 matting_type String 抠图类型。默认是AI。
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
给用户组授权之前,请您了解用户组可以添加的MetaStudio系统策略,并结合实际需求进行选择。 MetaStudio支持的系统策略请参见MetaStudio系统策略。若您需要对除MetaStudio之外的其它服务授权,IAM支持服务的所有策略请参见系统权限。 示例流程 图1 给用户授权MetaStudio权限流程
声音更新记录 2025年1月 表1 声音更新记录 发音人名称 性别 TTS版本 风格 语言 变更方式 云海 男 TTS V7 营销 中文 新增 云佳 女 TTS V7 客服 中文 新增 云辉 男 TTS V7 直播 中文 新增 云英 女 TTS V9 直播 中文 新增 云薇 女 TTS
zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav 支持手机录制20条语料音频(5分钟),1
如表1所示,包括了MetaStudio的所有系统策略。 表1 MetaStudio系统权限 策略名称 描述 策略类别 策略内容 MetaStudio FullAccess MetaStudio管理员权限,拥有该权限的用户可以拥有MetaStudio支持的全部权限。 系统策略 MetaStudio FullAccess策略内容
strings 分身数字人训练任务标签。 model_version 否 String 分身数字人模型版本。默认是V3.2版本模型。 V3.2:V3.2版本模型 说明: V3和V2版本已废弃不用 取值范围: 0-64 默认取值: V3.2 is_flexus 否 Boolean 是否是基础版的形象训练
频制作”,详见计费说明。 系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明。 系统声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。
设置视频的场景,包括如下内容。视频素材的操作详情,请参考视频制作公共配置。 模板:系统预置视频模板列表。支持基于系统预置模板,一键快速制作数字人视频。 注意:只有管理员可以自定义新增模板。 角色:自动展示系统预置的分身数字人列表,用户可以直接使用已有的数字人去创作生成视频。如果预置的数
and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"] projectId = "{project_id}"
错误码 获取项目ID 获取账号ID 直播控制HTTP Command命令说明 直播控制RTSA Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值 预置音色ID列表 查询音色ID
Go语言SDK供开发者使用,如表1所示。您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。 SDK已知安全漏洞及修复版本、规避方案,请单击表1中的SDK对应语言的Github地址进行查看。 表1 服务端SDK 语言 Github地址 参考文档 JAVA hu
频制作”,详见计费说明。 系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明。 系统声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。
启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。 确认声音制作任务已训练完成后,在左侧导航栏中,单击“我的创作”。
视频方向可能不对,竖屏横拍的素材需要旋转,确保被拍摄对象为竖向。 视频为非主流编码格式,可能是相机拍摄的视频采用了厂商的特定编码。需确保视频素材能通过Windows系统自带的播放器播放(须知编码与封装格式为不同的概念)。 父主题: 声音和形象制作