检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选
创建技能 表1 创建技能 参数 说明 技能名称 技能名称,必须与科大讯飞创建的技能一一对应,如在科大讯飞创建同名技能并导入技能文件所示。 为方便识别和记忆,两边的技能名称推荐相同。 技能标识 技能标识,必须与科大讯飞创建的技能标识保持一致,如在科大讯飞创建同名技能并导入技能文件所示。否
否 String 智能交互语言 zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN: 中文 EN: 英文 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。
授权书 分身形象或声音定制的授权书,如中文授权书和英文授权书所示。 父主题: 附录
所示。租户的项目ID必须与SP用户申请成为SP用户时,提供的项目ID所在Region保持一致。 租户名称:输入自定义租户名称,方便SP用户识别租户身份。 图2 关联租户 单击“创建”,租户创建完成,如图3所示。 图3 租户列表 如需取消关联,可单击右侧的“取消关联”,在弹出的“取
获取账号ID 直播控制HTTP Command命令说明 直播控制RTSA Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值 预置音色ID列表 查询音色ID
单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。 尾静音时长 云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束语音识别。建议该值大于500ms。 表2 创建应用 参数 说明 第三方应用 配置说明如下所示: 如果科大讯飞AIUI开放平台应用使用AIUI通用语
定提醒等。 163. 家用机器人还具备语音识别和语音回应功能,让您能够与机器人进行流畅的对话和交流。 164. 视觉交互:家用机器人配备了先进的摄像头和视觉传感器,可以通过图像识别和视觉感知与您进行交互。 165. 例如,机器人可以识别家庭成员的面孔、手势和身体姿势,并做出个性化的反应和服务。
数字人对话界面使用的语言。包含:中文、英文。 支持同时添加中文和英文,并设置其中一种语言为默认语言。在数字人智能交互界面,自动展示默认语言,并用默认语言与用户进行问答。可通过界面右上方的语言切换图标,切换语言。 注意:科大讯飞场景下,如果选择“英文”,科大讯飞应用要新增English
播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选
华为云提供了MetaStudio服务端SDK,您可以直接集成服务端SDK来调用MetaStudio的相关API,从而实现对MetaStudio服务的快速操作。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 您可以在API Explor
字幕中正常断句的符号,如中文符号、,。:;!?….. 等;英文符号,.:;!?...等,系统会自动去除。 如果自动去除的符号在一段文字中间,自动去除后,会再增加一个空格。 如果自动去除的符号在段落末尾,仅直接去除。 有些符号不会自动去除,如中文符号“”《》()·~——等;英文符号""《》()·~--等。 透明背景
热词记录ID。 robot_id String 应用ID。 hot_words_type String 热词类型。 说明: SIS:使用的语音识别服务为SIS时选此类型 vocabulary_id String 热词ID(sis中配置)。 sis_project_id String SIS服务所在区域projectId
language String 智能交互语言 zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN:中文 EN:英文 create_time String 创建时间,格式遵循:RFC 3339 如"2021-01-10T08:43:17Z"。 update_time
对应的系统权限并向用户告知征得其同意。 权限 权限描述 使用目的 获取麦克风权限 获取浏览器的麦克风设备权限 开始语音交互时,用于进行语音识别文字,获取交互答案 四、延迟初始化要求 为了避免您的应用在未获取用户的同意前SDK提前处理用户的个人信息。我们提供了智能交互任务创建接口c
如需全局生效,可参考配置特殊词表配置。 数字英文 示例数字“1024”的读法如下所示: 数字:一零二四 数值:一千零二十四 日期:十月二十四 电话:幺零二四 示例英文“API”的读法如下所示: 字母:API 单词:api 音标 选中英文单词,输入合适的音标。 局部语速 选中需要变速播报的文本,设置局部语速。
language String 智能交互语言 zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN:中文 EN:英文 create_time String 创建时间,格式遵循:RFC 3339 如"2021-01-10T08:43:17Z"。 update_time
单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。 尾静音时长 云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束语音识别。建议该值大于500ms。 图2 获取访问权限 单击“确定”,创建应用,创建效果如图3所示。 可单击“修改”,修改配置。 图3 创建应用
单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。 尾静音时长 云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束语音识别。建议该值大于500ms。 单击“确定”,创建应用,创建效果如图2所示。 可单击“修改”,修改配置。 图2 创建应用 (可选)单击“对话配
智能交互语言 zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN:中文 EN:英文 tail_silence_time 否 Integer 语音识别后端点静音时长默认500ms 取值范围: 0-3000 enable_question_audit 否 Boolean