在线调试 API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。 本章节以语音合成为例,介绍如何使用API Explorer调试API。 前提条件 注册华为账号并开通华为云,并完成实名认证,
一句的识别。 如果设置为0,表示不检测“长时间静音”情况。 取值范围:[0, 60000]的整数,单位为ms,默认为10000ms,即10s。 vad_tail 否 Integer 音频的结尾中的静音时间,正常情况下不应设成很小的值。 如果检测语音结尾的静音时长大于等于此值时,在
接口的使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了录音文字识别的在线使用页面,用户无需编程即可使用服务功能。 图1 在线使用 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成
连续识别模式在流式识别的基础上,结合了语音的端点检测功能。语音数据也是分段输入,但是连续识别模式将会在处理数据之前进行端点检测,如果是语音才会进行实际的解码工作,如果检测到静音,将直接丢弃。如果检测到一段语音的结束点,就会直接将当前这一段的识别结果返回,然后继续检测后面的语音数据。因此在连续识别模
或者16bit。 支持中文普通话、方言和英语的语音识别,其中方言包括:四川话、粤语和上海话。 方言和英语仅支持“华北-北京四”区域。 端点检测参数(vad_head、vad_tail、max_seconds)会影响句子的分段结果,存在一定误差。对连续模式和单句模式生效,对流式一句话模式无效。
功能介绍 单句模式自动检测一句话的结束,因此适合于需要与您的系统进行交互的场景,例如外呼、控制口令等场景。 实时语音识别引擎的单句识别模式,和连续识别模式类似,也会进行语音的端点检测,如果检测到静音,将直接丢弃,检测到语音才会馈入核心进行实际的解码工作,如果检测到一段语音的结束点,
该接口的使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了语音合成的在线使用页面,用户无需编程即可使用服务功能。 图1 在线使用 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成
该接口的使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了一句话识别的在线使用页面,用户无需编程即可使用服务功能。 图1 在线使用 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成
过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。 在线体验中心 无需编写代码,即可在线使用一句话识别、录音文件识别、语义合成功能:https://console.huaweicloud.com/sis/#/s
音短消息、有声读物、电话回访等场景。 在使用服务前,请先使用在线体验中心体验服务功能。该方式无需编程,只需在网页端上传文字或音频,即可体验合成效果。 使用SIS体验中心前,请先注册华为账号并开通华为云。 图1 SIS在线使用
information: calc ak sk signature fail:signature expired报错。表示的是AK、SK凭证过期。 请先检测您使用的是临时AK、SK,还是永久性AK、SK。临时安全凭证通过接口临时访问密钥AK/SK获取;永久安全凭证通过我的凭证界面控制台获取。
needAnalysisInfo 否 Boolean 是否选择分析信息。当前仅对8k模型有效。 如果选择false,则声道、话者分离、情绪检测、速度信息均无效。默认false。 diarization 否 Boolean 是否需要话者分离,表示识别结果会包含role项,默认true。
event取值范围及其说明 表2 event取值范围 事件 说明 VOICE_START 检测到句子开始。 VOICE_END 检测到句子结束。 EXCEEDED_SILENCE 静音超长,也即没有检测到声音。 在流式一句话模式下: 不会返回VOICE_START、VOICE_END、
/** * 检测到句子开始事件 */ @Override public void onVoiceStart() { } /** * 检测到句子结束事件
服务韧性 SIS提供三级可靠性架构,通过AZ之间容灾、AZ内实例冗余、实例健康检测等技术方案,保障服务的可靠性。 父主题: 安全
调用API接口需要具备一定的编程开发能力,返回的结果为JSON格式,用户需要通过编程来处理识别结果。 您可以根据以下介绍选择合适的使用方式: 通过在线体验中心,无需编写代码,在线快速体验语音交互功能。 如果您是业务开发者,没有代码编写基础,您可以使用该方式体验语音交互服务的一句话识别和语音合成功能。该方式只能用于体验,不能用于开发。
01 了解 了解华为语音交互服务的产品介绍、应用场景、使用限制,有助于更好的使用语音交互服务。 产品介绍 什么是SIS 应用场景 约束限制 在线体验 03 入门 华为云SIS服务以开放API(Application Programming Interface,应用程序编程接口)的方
调用API或SDK 在线调试 本地调用
试功能,但该SDK暂不支持通过websocket的方法调用的API。如需使用websocket接口,请前往SDK(websocket)。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 SDK列表 在开始使用之前,
中、英文以及数字的混合识别。 即时输出识别结果 连续识别语音流内容,即时输出结果,并可根据上下文语言模型自动校正。 自动静音检测 对输入语音流进行静音检测,识别效率和准确率更高。 产品优势 识别准确率高 采用最新一代语音识别技术,基于深度神经网络(Deep Neural Netw
您即将访问非华为云网站,请注意账号财产安全