检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买
3 音频制作区域 音频制作区域,可选择下述1种方式生成音频。 文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方
resource.type.metastudio.modeling.videodriving.channel - 声音合成 百万字声音合成 万字 按需 hws.resource.type.metastudio.modeling.voice.synthetics - 资产管理 资产管理
直播间配置约束 直播间配置限制,如表1所示。 表1 直播间限制 直播间配置 限制 文本驱动 每个单场景中所有段落输入文字的总量需大于200字。 每个段落的文本字符数量需小于2000,如果包含语音合成标记语言SSML标签,需小于3000。 整个直播间所有段落的文本总字符数,如果包含
参数解释: 语速。50表示0.5倍语速,100表示正常语速,200表示2倍语速。 当取值为“100”时,表示一个成年人的正常语速,约为250字/分钟。 约束限制: 不涉及。 取值范围: 50-200 默认取值: 100 pitch Integer 参数解释: 音高。 约束限制: 不涉及。
音色ID,获取方式详见获取音色ID。 speed 否 integer body 语速。 当取值为“100”时,表示一个成年人正常的语速,约为250字/分钟。 50表示0.5倍语速,100表示正常语速,200表示2倍语速。 取值范围:[50,200] 默认值:100 pitch 否 integer
is_support_phoneme 否 Boolean 参数解释: 该声音是否支持中文多音字。 约束限制: 不涉及 取值范围: true: 支持中文多音字 false: 不支持中文多音字 默认取值: false is_support_break_time 否 Boolean 参数解释:
(直播) CHANNEL:路(直播/交互) GB:GB(资产管理) MILLION_WORDS:百万字 TEN_THOUSAND_WORDS:万字 TIME:次 状态码: 400 表7 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg
String 商品名称 description 否 String 商品描述 tags 否 Array of strings 标签。单个标签16字节,多个用逗号分隔,最多50个。 cover 否 ProductCoverInfo object 商品封面信息 text_list 否 Array
String 商品名称 description 否 String 商品描述 tags 否 Array of strings 标签。单个标签16字节,多个用逗号分隔,最多50个。 cover 否 ProductCoverInfo object 商品封面信息 text_list 否 Array
String 音色ID,获取方式详见获取音色ID。 speed 否 Integer 语速。 当取值为“100”时,表示一个成年人正常的语速,约为250字/分钟。 50表示0.5倍语速,100表示正常语速,200表示2倍语速。 取值范围: 50-200 默认取值: 100 pitch 否 Integer
name String 商品名称 description String 商品描述 tags Array of strings 标签。单个标签16字节,多个用逗号分隔,最多50个。 cover ProductCoverDetailInfo object 商品封面信息 text_list Array
status String 状态 sex String 性别 默认取值: UNKNOW tags Array of strings 标签。单个标签16字节,多个用逗号分隔,最多50个。 style_assets Array of StyleAssetItem objects 风格化素材资产组合。
false is_support_phoneme Boolean 参数解释: 该声音是否支持中文多音字。 约束限制: 不涉及 取值范围: true: 支持中文多音字 false: 不支持中文多音字 默认取值: false is_support_break_time Boolean 参数解释:
is_support_phoneme 否 Boolean 参数解释: 该声音是否支持中文多音字。 约束限制: 不涉及 取值范围: true: 支持中文多音字 false: 不支持中文多音字 默认取值: false is_support_break_time 否 Boolean 参数解释:
参数解释: 语速。50表示0.5倍语速,100表示正常语速,200表示2倍语速。 当取值为“100”时,表示一个成年人的正常语速,约为250字/分钟。 约束限制: 不涉及。 取值范围: 50-200 默认取值: 100 pitch 否 Integer 参数解释: 音高。 约束限制:
String 音色ID,获取方式详见获取音色ID。 speed 否 Integer 语速。 当取值为“100”时,表示一个成年人正常的语速,约为250字/分钟。 50表示0.5倍语速,100表示正常语速,200表示2倍语速。 取值范围: 50-200 默认取值: 100 pitch 否 Integer
于判断流式文本的最后一包数据。如果不使用流式文本消息,seq设置为“1”,is_last设置为“true”。 建议每个分包数据长度大于6个字,否则可能会导致数字人说话卡顿。 详细交互流程如下所示: 用户发送文本驱动消息。 代码示例如下所示: { "request_id":
name String 商品名称 description String 商品描述 tags Array of strings 标签。单个标签16字节,多个用逗号分隔,最多50个。 cover ProductCoverDetailInfo object 商品封面信息 text_list Array
udio。</speak> insert-action id通过查询资产列表接口获取,查询时asset_type=ANIMATION 多音字标签:<phoneme ph="拼音">汉字</phoneme>,南京<phoneme ph="shi4 zhang3">市长</phoneme>江大桥。