检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
47010090 App Id为空 App Id为空 请携带正确的App Id信息 400 MSS.47010091 App Key为空 App Key为空 请携带正确的App Key信息 400 MSS.47010092 App Secret为空 App Secret为空 请携带正确的App
ish情景模式,才能对话成功。 情景模式名称必须为“English”,English情景模式下,不支持开启系统预置技能,仅支持开启自定义技能。一个应用可以增加多个情景模式,每个情景模式相互独立,互不干扰。 父主题: 创建智能交互数字人(科大讯飞)
2024-12-30 第十四次正式发布 本次变更如下: 语音合成管理接口组,新增接口:设置TTS租户级自定义读法配置、获取TTS租户级自定义读法配置、删除TTS租户级自定义读法配置、修改TTS租户级自定义读法配置。 2024-12-05 第十三次正式发布 本次变更如下: 新增接口组:分身数字人字幕文件生成管理。
台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。 取值范围: 字符长度0-131072位。 默认取值: 不涉及。 表15
参数类型 描述 voice_asset_id 否 String 语音合成特征字符串 speed 否 Integer 语速。默认值100,最小值50,最大值200。 说明: 当取值为“100”时,表示一个成年人正常的语速,约为250字/分钟。 取值范围: 50-200 默认取值: 100
参数 参数类型 描述 voice_asset_id String 语音合成特征字符串 speed Integer 语速。默认值100,最小值50,最大值200。 说明: 当取值为“100”时,表示一个成年人正常的语速,约为250字/分钟。 取值范围: 50-200 默认取值: 100
表1中的SDK对应语言的Github地址进行查看。 表1 服务端SDK 语言 Github地址 参考文档 JAVA huaweicloud-sdk-java-v3 Java SDK使用指导 Python huaweicloud-sdk-python-v3 Python SDK使用指导
参数类型 描述 voice_asset_id 否 String 语音合成特征字符串 speed 否 Integer 语速。默认值100,最小值50,最大值200。 说明: 当取值为“100”时,表示一个成年人正常的语速,约为250字/分钟。 取值范围: 50-200 默认取值: 100
参数 参数类型 描述 voice_asset_id String 语音合成特征字符串 speed Integer 语速。默认值100,最小值50,最大值200。 说明: 当取值为“100”时,表示一个成年人正常的语速,约为250字/分钟。 取值范围: 50-200 默认取值: 100
不同声音模型对表1中操作的支持情况有差异,所以如果表1中操作项置灰,说明当前声音模型不支持此操作。需要重新选择一个支持所需操作的声音模型进行设置。 表1 操作说明 操作 说明 插入停顿 在段落的某个位置,插入换气或者停顿时间,也支持自定义停顿时长。 多音字 选中文字,设置多音字的正确读音。 全局语速 设置全局语速,取值范围[0
Flexus分身数字人 按Flexus数字人生成个数和声音克隆个数计费。 须知: 每提交一个Flexus分身数字人定制任务,会同时生成一个Flexus形象和一个Flexus声音,对应消耗一个形象资源和一个声音资源。 按需预付费套餐包 一次性计费 Flexus分身数字人视频制作 按Flexus数字人视频制作时长计费。
台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。 取值范围: 字符长度0-131072位。 默认取值: 不涉及。 表12
创建TTS试听任务 获取TTS试听文件 创建TTS异步任务 获取TTS异步任务 设置TTS租户级自定义读法配置 获取TTS租户级自定义读法配置 删除TTS租户级自定义读法配置 修改TTS租户级自定义读法配置 语音同步合成WebSocket接口
10次/秒 10次/秒 设置TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 获取TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 删除TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 修改TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 表4
台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。 取值范围: 字符长度0-131072位。 默认取值: 不涉及。 表13
台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。 取值范围: 字符长度0-131072位。 默认取值: 不涉及。 表12
FullAccess”已生效。 MetaStudio自定义策略 如果系统预置的MetaStudio权限,不满足您的授权要求,可以创建自定义策略。 目前华为云云服务平台支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作
台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。 取值范围: 字符长度0-131072位。 默认取值: 不涉及。 表10
SDK默认方式展示效果 富媒体展示效果(自定义方式) 用户与数字人进行智能交互的页面,默认为用户需要自定义富媒体的展示效果,即用户自定义UI界面展示。 通过注册事件通知semanticRecognized获取回复文本,用户可以自行提取图片、视频标签进行自定义显示。 父主题: 智能交互
台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。 取值范围: 字符长度0-131072位。 默认取值: 不涉及。 表13