检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三
I实现与数字人对话场景。 开发者基于智能交互服务定义的API接口结构,自主开发第三方语言模型API,对接第三方语言模型到智能交互服务,实现智能交互能力。操作请参考创建智能交互数字人(第三方语言模型)。 场景三:用户使用智能交互API或SDK,自主开发实现与数字人对话场景。 用户购
5倍速度阅读。 是 语速值 标签关系 可以包含文本,不可以包含其他标签。 备注 1 <prosody rate="50">大家好,我是MetaStudio数字人</prosody> word标签 描述 <word></word>:设置选中文字为连读模式。选中文字只能包含文字,不能有标点符号或者空格等字符。
一种音频生成方式。 文本驱动 在文本输入框中,输入文本内容,以生成音频,如图1所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物和鲜花,场地宽敞明亮,足够大家在室内共同交流和活动。 图1 文本驱动 文本内容的操作说明如表1所示。
需要将两条通知的text值拼接在一起才是完整的内容。 文本问答的用法 智能交互默认是语音问答,如需使用文本问答,需要切换模式。可以通过下述2种方式处理: 在开始对话时设置。使用startChat接口开启对话时,设置成文本问答模式,如下所示: const { result } =
发音人名称 性别 语言 TTS版本 对话女生 女 中文 TTS V7 广告男声 男 中文 TTS V7 教育女声 女 中文 TTS V7 客服男声 男 中文 TTS V7 客服女声 女 中文 TTS V7 云景行 男 中文 TTS V7 直播男声 男 中文 TTS V7 父主题: 声音制作
查看会话记录 可以参考本章节,查看已创建角色的对话记录。 操作步骤 登录奇妙问,左侧导航栏中,选择“会话记录”,如图1所示。 会话记录页面会展示所有角色的历史会话记录。 图1 会话记录 支持对会话进行如下操作。 可以通过项目名称、会话开始时间、会话结束时间,快速查询或者导出需要查
前提条件 MetaStudio创建对话时,如果“第三方应用”选择“奇妙问”时,才需要执行创建智能交互数字人(奇妙问)操作,详情请参考表1。 父主题: 创建智能交互数字人(奇妙问)
音乐:各类音乐列表,可本地导入音频文件。支持添加为背景音乐。 文本:用于在画布中添加文本。 2 画面布局区域 视频画面制作区域,可以制作和预览视频画面。 3 音频制作区域 音频制作区域,可选择下述1种方式生成音频。 文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置
开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。开通后的效果如图1所示。 如需使用第三方声音进行语音合成,请购买出门问问声音套餐。 图1 声音合成 功能介绍 该接口用于TTS流式合成音频,用于文本转化为语音,并实时返回合成的音频数据。 调用方法
切换交互模式(语音问答/文本问答)。 interruptSpeaking 中断数字人讲话。 muteRemoteAudio 数字人静音。 sendDrivenText 发送智能交互数字人主动播报的文本信息。 sendTextQuestion 发送问题文本。 setConfig 更新配置项。
使用AK/SK方式认证时必选,携带项目ID信息。 X-App-UserId 否 String 第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 text 是 String 待合成文本 voice_asset_id 是 String 音色ID,获取方式详见获取音色ID。 speed
如文案样例(基础版)、文案样例(进阶版)和文案样例(高品质)所示。如果使用预置文案,必须选对标签。 请输入试听文本 请输入试听文本,声音训练完成以后,您可以试听该文本的合成效果。 声音授权 单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件
图3所示。 参数配置说明,如表1所示。 图3 创建角色 表1 参数说明 参数 说明 语言 包含中文和英语。 单语言场景,可直接切换语言类型。 多语言场景,可单击右侧的“添加语言”,将中文和英语都添加上。 角色名称 互动数字人的角色名称。 示例:售货员。 角色描述 互动数字人的角色描述信息。
获取数字人互动页面URL的方式还有:进入“我的创作 > 智能交互 > 对话项目”页面,单击智能交互对话项目右侧的“生成URL并复制”,将URL分享给其他用户使用。 图4 智能交互对话项目 复制URL至浏览器中,访问数字人互动页面。 界面弹出激活码输入对话框,请参考下述操作获取激活码: 在智能交互编辑页面,单击左侧导航栏中的“发布”。
text string 识别结果文本。 questionText string 问题文本。 resultId number 识别流式响应时返回的各包顺序序号。 isLast boolean 是否是最后一条识别结果。 chatId string 对话ID,每轮问答的ID值唯一。 s
单击“管理技能配置”,弹出“配置应用需要的技能”对话框,如图10所示。 需要依次打开如下开关: 在“自定义”区域,找到创建的技能。先开启开关,再单击右下角的开关,在弹出的“技能设置”对话框中,选择需要使用的技能版本。 此时,应用已具备基础的对话能力,可以回答已配置的语料内容。 开启问答
前提条件 MetaStudio创建对话时,如果“第三方应用”需要选择“科大讯飞AIUI通用语义模型”或“科大讯飞星火交互认知大模型”时,才需要执行创建智能交互数字人(科大讯飞)操作,详情请参考表1。 父主题: 创建智能交互数字人(科大讯飞)
动内容。 回复方式 选择主播或助播进行回复,具体回复内容支持通过下述方式设置。 文本:通过文本方式设置回复内容,最多可增加5条回复。直播间开播后按照触发次数,从前往后依次命中答复,每次仅回复一条文本内容。 示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。
在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三