检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单击“新建词表”,界面新增一行特殊词,如图2所示。 在“原始词”列输入原始内容。 在“新建读法”列,输入拼音后,从下拉框中选择正确的读音。如有多个字,需单击“+”号图标,依次输入各文字的拼音。 图2 新建词表 单击新增特殊词右侧的“确定”,新增成功。 如有更多特殊词,可参考上述步骤依次添
AH0">weather</phoneme> is very good. 属性 表2 属性说明 属性名称 属性类型 属性值 是否必选 描述 ph String 拼音或音素 是 输入汉语拼音时,声调用1、2、3、4来表示,5表示轻声。 CMU词典音素。 举例1:天气的ph取值为“tian1 qi4”。 举例2:we
为毫秒,最小值为200毫秒。 <phoneme>:多音字标签,可指定单个汉字的读音。标签起始和结束中间只能有1个汉字。属性可取值为汉语拼音,声调用1、2、3、4来表示。用法为:<phoneme ph="拼音"/>字</phoneme>。 说明: 举例:<speak> <emotion
insert-action id通过查询资产列表接口获取,查询时asset_type=ANIMATION 多音字标签:<phoneme ph="拼音">汉字</phoneme>,南京<phoneme ph="shi4 zhang3">市长</phoneme>江大桥。 停顿标签:<break
授权书 分身形象或声音定制的授权书,如中文授权书和英文授权书所示。 父主题: 附录
按照平时的说话习惯录制。 拍摄流程 支持手机或相机拍摄,需1080P或更高分辨率。 录制时长为2分钟,包含15秒静默转态和1分45秒的演讲过程。 允许使用中文、英文录制。 录制全程眼睛需注视镜头,周围环境保持安静,脸部光照明亮且均匀。 拍摄完成后不要剪辑,整个视频一起上传至MetaStudio控制台。
图中标识“1”处为语言修改配置。请根据实际情况切换语言,目前仅支持中文和英文。 图中标识“2”处为声音切换入口。单击图标,弹出如图3所示的对话框,选择需要切换的声音。 请注意,切换后的声音必须与前面切换后的语言保持一致。如果语言选择英文,声音选择中文声音,那么界面交互时数字人会没有声音。 图2 配置对话
图中标识“1”处为语言修改配置。请根据实际情况切换语言,目前仅支持中文和英文。 图中标识“2”处为声音切换入口。单击图标,弹出如图3所示的对话框,选择需要切换的声音。 请注意,切换后的声音必须与前面切换后的语言保持一致。如果语言选择英文,声音选择中文声音,那么界面交互时数字人会没有声音。 图2 配置对话
表1 服务支持的字体说明 字体名称 支持的语言类型 Adelle_Sans_Global Adelle_Sans_Global_Bold 中文、英文、德语、法语、土耳其语、菲律宾语、日语、意大利语、马来语、俄罗斯语、越南语、芬兰语、荷兰语、西班牙语、印尼语、阿拉伯语、葡萄牙语 HarmonyOS_Sans_SC
第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 robot_id 是 String 机器人ID。 hot_question 是 String 热点问题。 language 否 String 智能交互语言 zh_CN:简体中文(已下线,请使用CN)
第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 robot_id 是 String 应用ID。 welcome_speech 是 String 欢迎词。 language 否 String 智能交互语言 zh_CN:简体中文(已下线,请使用CN)
字幕 字幕中正常断句的符号,如中文符号、,。:;!?….. 等;英文符号,.:;!?...等,系统会自动去除。 如果自动去除的符号在一段文字中间,自动去除后,会再增加一个空格。 如果自动去除的符号在段落末尾,仅直接去除。 有些符号不会自动去除,如中文符号“”《》()·~——等;英文符号""《》()·~--等。
0:北京四;3:上海一; 取值范围: 0-32 language 是 String 智能交互语言 zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN:中文 EN:英文 响应参数 状态码: 200 表5 响应Header参数 参数 参数类型 描述 X-Request-Id
0:北京四;3:上海一; 取值范围: 0-32 language 否 String 智能交互语言 zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN:中文 EN:英文 响应参数 状态码: 200 表5 响应Header参数 参数 参数类型 描述 X-Request-Id
需参考创建热词表,创建一个热词表,再参考调用热词表,复制热词ID至当前“热词ID”配置中。 声音 这里选择的声音,需要与前面选择的语言匹配。如果是中文,则选择中文声音,否则数字人表达会有问题。 还可以根据实际情况,设置语速、音量和音高。 语速:设置语速,取值范围[0.5X,2X]。设置为0.5X时,声音放慢至0
图3所示。 参数配置说明,如表1所示。 图3 创建角色 表1 参数说明 参数 说明 语言 包含中文和英语。 单语言场景,可直接切换语言类型。 多语言场景,可单击右侧的“添加语言”,将中文和英语都添加上。 角色名称 互动数字人的角色名称。 示例:售货员。 角色描述 互动数字人的角色描述信息。
String 智能交互对话任务ID。 language String 智能交互语言 zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN:中文 EN:英文 rtc_room_info RTCRoomInfoList object RTC房间信息。
第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 robot_id 是 String 应用ID。 enable_welcome_speech 是 Boolean 欢迎词功能开关。 language 否 String 智能交互语言 zh_CN:简体中文(已下线,请使用CN)
voice_name 否 String 音色名称。该名称会作为资产库中音色模型资产名称。 language 否 String 训练语言,当前仅支持中文。 CN: 中文 EN: 英文 phone 否 String 手机号 app_user_id 否 String 第三方用户id 响应参数 状态码:
4: 等待休眠 取值范围: 0-32 language String 智能交互语言 zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN:中文 EN:英文 chat_video_type String 智能交互对话端配置。 COMPUTER: 电脑端