检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单击右上方的“导入”,从本地导入不少于200字的txt文件。如果多个段落,可通过换行来实现,平台会自动解析输入内容。 手工输入文本示例,如下所示: 请注意,当前仅为效果演示,实际需要满足单场景不少于200字,单段落不多于2000字的要求。 段落1.1:大家好,今天欢迎来到会议室
支持的格式为:MP3、WAV。 大小不超过20MB,时长不超过5分钟。 文本驱动 文本驱动方式的要求如下所示: 文本输入长度不超过2000字。 通过文本合成的音频时长不能超过5分钟。 在照片数字人制作页面,选择“文本驱动”方式驱动照片说话时,需要输入文本并选择音色,再单击“试听”
一个视频制作剧本的场景数量不能超过50个。 一个视频制作剧本,仅支持使用一个数字人模型和一个音色模型。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。 每个单场景如果包含语音合成标记语言SSML标签,文字数量需小于128K。 音频驱动 每个单场景上传音频的大小不超过100M。
能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考购买出门问问声音套餐。 请填写名片信息 姓名 必填项,数字人姓名。 不能超过32字符。 职称 必填项,数字人职称。
time="停顿时长"/>。time的单位为毫秒,最小值为200毫秒。 <phoneme>:多音字标签,可指定单个汉字的读音。标签起始和结束中间只能有1个汉字。属性可取值为汉语拼音,声调用1、2、3、4来表示。用法为:<phoneme ph="拼音"/>字</phoneme>。 说明: 举例:<speak> <emotion
音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买
3 音频制作区域 音频制作区域,可选择下述1种方式生成音频。 文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方
type.metastudio.modeling.Interaction.pro.channel 当前未启用 声音合成 百万字声音合成 万字 按需 hws.resource.type.metastudio.modeling.voice.synthetics - 资产管理 资产管理
直播间配置约束 直播间配置限制,如表1所示。 表1 直播间限制 直播间配置 限制 文本驱动 每个单场景中所有段落输入文字的总量需大于200字。 每个段落的文本字符数量需小于2000,如果包含语音合成标记语言SSML标签,需小于3000。 整个直播间所有段落的文本总字符数,如果包含
参数解释: 语速。50表示0.5倍语速,100表示正常语速,200表示2倍语速。 当取值为“100”时,表示一个成年人的正常语速,约为250字/分钟。 约束限制: 不涉及。 取值范围: 50-200 默认取值: 100 pitch Integer 参数解释: 音高。 约束限制: 不涉及。
音色ID,获取方式详见获取音色ID。 speed 否 integer body 语速。 当取值为“100”时,表示一个成年人正常的语速,约为250字/分钟。 50表示0.5倍语速,100表示正常语速,200表示2倍语速。 取值范围:[50,200] 默认值:100 pitch 否 integer
is_support_phoneme 否 Boolean 参数解释: 该声音是否支持中文多音字。 约束限制: 不涉及 取值范围: true: 支持中文多音字 false: 不支持中文多音字 默认取值: false is_support_break_time 否 Boolean 参数解释:
String 商品名称 description 否 String 商品描述 tags 否 Array of strings 标签。单个标签16字节,多个用逗号分隔,最多50个。 cover 否 ProductCoverInfo object 商品封面信息 text_list 否 Array
String 商品名称 description 否 String 商品描述 tags 否 Array of strings 标签。单个标签16字节,多个用逗号分隔,最多50个。 cover 否 ProductCoverInfo object 商品封面信息 text_list 否 Array
name String 商品名称 description String 商品描述 tags Array of strings 标签。单个标签16字节,多个用逗号分隔,最多50个。 cover ProductCoverDetailInfo object 商品封面信息 text_list Array
String 音色ID,获取方式详见获取音色ID。 speed 否 Integer 语速。 当取值为“100”时,表示一个成年人正常的语速,约为250字/分钟。 50表示0.5倍语速,100表示正常语速,200表示2倍语速。 取值范围: 50-200 默认取值: 100 pitch 否 Integer
(直播) CHANNEL:路(直播/交互) GB:GB(资产管理) MILLION_WORDS:百万字 TEN_THOUSAND_WORDS:万字 TIME:次 状态码:400 表7 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg
参数解释: 语速。50表示0.5倍语速,100表示正常语速,200表示2倍语速。 当取值为“100”时,表示一个成年人的正常语速,约为250字/分钟。 约束限制: 不涉及。 取值范围: 50-200 默认取值: 100 pitch 否 Integer 参数解释: 音高。 约束限制:
is_support_phoneme 否 Boolean 参数解释: 该声音是否支持中文多音字。 约束限制: 不涉及 取值范围: true: 支持中文多音字 false: 不支持中文多音字 默认取值: false is_support_break_time 否 Boolean 参数解释:
false is_support_phoneme Boolean 参数解释: 该声音是否支持中文多音字。 约束限制: 不涉及 取值范围: true: 支持中文多音字 false: 不支持中文多音字 默认取值: false is_support_break_time Boolean 参数解释: