检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在线调试 API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。 本章节以语音合成为例,介绍如何使用API Explorer调试API。 前提条件 注册华为账号并开通华为云,并完成实名认证,
华东-上海一,推荐的区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。 音频采样率8KHz或者16KHz,采样位数8bit或者16bit。 支持中文普通话、方言和英语的语音识别,其中方言包括:四川话、粤语和上海话。 方言和英语仅支持“华北-北京四”区域。 端点检测参数(vad_head
该接口的使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了语音合成的在线使用页面,用户无需编程即可使用服务功能。 图1 在线使用 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成
接口的使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了录音文字识别的在线使用页面,用户无需编程即可使用服务功能。 图1 在线使用 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成
、实时语音识别和语音合成和热词等接口。 华东-上海一,推荐的区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。 支持中文、英文、中英文,文本不长于500个字符。 支持合成采样率8kHz、16kHz。 父主题: 约束与限制
语音时长不超过5小时,文件大小不超过300M,用户的识别任务在6小时内完成并返回识别结果,识别结果保存72小时(从转写完成的时间算起)。 支持中文普通话、四川话识别。 父主题: 约束与限制
配置OBS访问权限。obs_bucket_name长度大于等于3个字符,小于64个字符,不需要进行urlencode编码,如果包含中文,直接输入中文即可。 示例 obs url为https://test.obs.cn-north-4.myhuaweicloud.com/data/0601/test
配置OBS访问权限。obs_bucket_name长度大于等于3个字符,小于64个字符,不需要进行urlencode编码,如果包含中文,直接输入中文即可。 示例 obs url为https://test.obs.cn-north-4.myhuaweicloud.com/data/0601/test
8bit、wav、amr、amrwb等多种格式,详见API参考文档中的“audio_format取值范围”。 音频时长不超过1分钟。 支持中文普通话、方言和英语的语音识别,其中方言包括:四川话、粤语和上海话。 方言仅支持“华北-北京四”区域,英语仅支持“华东-上海一”区域。 父主题:
该接口的使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了一句话识别的在线使用页面,用户无需编程即可使用服务功能。 图1 在线使用 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成
-cn4,obs_object_key值为abc/16k_pcm.wav。如果上传至OBS桶中的文件或OBS路径为中文,obs_object_key的值需要采用中文形式。 obs_object_key 是 String 表示OBS对象桶中的对象的键值,长度小于1024个字符,需要进行urlencode编码。
试功能,但该SDK暂不支持通过websocket的方法调用的API。如需使用websocket接口,请前往SDK(websocket)。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 SDK列表 在开始使用之前,
支持采样率为8k的中文普通话语音识别,采用新一代端到端识别算法,识别准确率更高。 区域支持cn-east-3和cn-north-4(强烈推荐使用)。不支持max_seconds参数,自动通过静音判断一句话结束与否。 chinese_16k_general 支持采样率为16k的中文普通话语音
塔)。 所有数字均用相应的汉字表示,避免使用阿拉伯数字 ,如:12345服务热线(正确示例为:一二三四五服务热线)。 热词内容仅包含英文和中文,避免出现标点符号、特殊字符或空格,如:。,?.*等。 尽量避免配置单音节的英文单词,避免误召回,如:MAY/TEE等。 使用热词表功能时
支持哪些语言 录音文件识别、语音合成支持中文普通话。 一句话识别和实时语音识别支持中文普通话,带方言口音的普通话和方言(四川话、粤语和上海话)。 父主题: 产品咨询类
词之间用逗号分隔。 热词表支持英文和中文语言类型。中文语言类型的热词最长支持32字符,英文语言类型的热词最长支持64字符。 前端热词创建过程中,具备热词规则校验能力,会将不符合规则的热词返回给用户。 图1 创建热词表 创建热词时,需注意: 中文语言类型(chinese_manda
调用API或SDK 在线调试 本地调用
请求消息体 请求消息体通常以结构化格式发出,与请求消息头中Content-type对应,传递除请求消息头之外的内容。若请求消息体中参数支持中文,则中文字符必须为UTF-8编码。 每个接口的请求消息体内容不同,也并不是每个接口都需要有请求消息体(或者说消息体为空),GET、DELETE
电话回访 在客服系统场景中,通过将回访内容转换成人声,直接使用语音和客户交流,提升用户体验。 智能教育 集成语音合成的教育系统可以实现中文标准朗读及带读,应用于课堂和学生自学,提升教学效率。 直播实时字幕 将视频直播或现场直播中的音频实时转为字幕,为观众提供更高效的观会体验,方便对直播内容进行监控。
功能介绍 实时语音识别 实时语音识别服务,用户通过实时访问和调用API获取实时语音识别结果,支持的语言包含中文普通话、方言和英语,方言当前支持四川话、粤语和上海话。 文本时间戳 为音频转换结果生成特定的时间戳,从而通过搜索文本即可快速找到对应的原始音频。 智能断句 通过提取上下文