检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
websocket-client。 操作步骤 下载SDK,通过pip-list命令查看安装包。若未安装,则执行以下命令: pip install setuptools pip install requests pip install websocket-client 进入下载的Python
、控制口令等场景。 实时语音识别引擎的单句识别模式,和连续识别模式类似,也会进行语音的端点检测,如果检测到静音,将直接丢弃,检测到语音才会馈入核心进行实际的解码工作,如果检测到一段语音的结束点,就会将当前这一段的识别结果返回。和连续识别不同的是,在单句模式下,返回第一段的识别结果
端点检测功能。语音数据也是分段输入,但是连续识别模式将会在处理数据之前进行端点检测,如果是语音才会进行实际的解码工作,如果检测到静音,将直接丢弃。如果检测到一段语音的结束点,就会直接将当前这一段的识别结果返回,然后继续检测后面的语音数据。因此在连续识别模式中,可能多次返回识别结果
event取值范围及其说明 表2 event取值范围 事件 说明 VOICE_START 检测到句子开始。 VOICE_END 检测到句子结束。 EXCEEDED_SILENCE 静音超长,也即没有检测到声音。 在流式一句话模式下: 不会返回VOICE_START、VOICE_END、EXCEEDED_SILCENCE事件。
NCE事件,表示超过vad_head没有检测到声音,通常表示用户一直没有说话。此时后续的音频将被忽略,不会再进行识别(连续模式可忽略)。 表6 RasrConnProcessListener 函数 描述 void onTranscriptionConnect() webSocket连接建立后回调。
Eclipse 在Eclipse官网下载对应平台的Eclipse版本,比如:eclipse-jee-mars-R-win32-x86_64.zip。 Idea 在Idea官网下载对应平台的idea版本,比如:ideaIU-2023.2.2.exe。 导入SDK Eclipse导入SDK。
录音文件识别配置信息。 data_url 是 String 存放录音文件地址: 推荐使用华为云OBS:授权配置请参见配置OBS服务。 您也可以把录音文件放在自行搭建服务器上,提供下载文件的地址。URL不能使用IP地址,只能使用域名,请尽量避免中文。 表5 TranscriberConfig
其他语言暂未支持。 表1 下载SDK包 SDK语言 下载地址 Java https://sis-sdk-repository.obs.cn-north-1.myhuaweicloud.com/java/huaweicloud-java-sdk-sis-1.8.3.zip Python
设置是否需要速度。默认true。 request.setSpeed(true); // 设置回调地址,设置后音频转写结果将直接发送至回调地址。请务必保证地址可联通,不支持ip地址。 // request.setCallbackUrl(""); // 设置热词id,不使用则不用填写
区创建资源。 区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Region指面向公共租户提供通用云服务的Region;专属Re
vocabulary_id 是 String 热词ID。 name 是 String 热词表名。 language 是 String 热词表语言类型。 description 是 String 热词表描述。 状态码: 400 表7 响应Body参数 参数 参数类型 描述 error_code String
是否必选 参数类型 描述 name 是 String 热词表名,不可重复。内容限制为字母,数字,下中划线和井号,长度不超过32字节。 description 否 String 热词表描述,长度不超过255字节。 language 是 String 热词表语言类型。 language取值
函数名称 作用 void onTranscriptionConnect(); webSocket建立连接后后调。 void onTranscriptionClose(); webSocket连接关闭后回调。 void onTranscriptionFail(RttsResponse
调用成功返回热词表名,调用失败时无此字段。 language 是 String 调用成功返回热词表语言类型,调用失败时无此字段。 description 是 String 调用成功返回热词表描述,调用失败时无此字段。 contents 是 Array of strings 调用成功返回热词列表,调用失败时无此字段。
是否必选 参数类型 描述 data_url 是 String 存放录音文件地址: 推荐使用华为云OBS:授权配置请参见OBS配置。 您也可以把录音文件放在自行搭建服务器上,提供下载文件的地址。URL不能使用IP地址,只能使用域名,请尽量避免中文 audio_format 是 String
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同。 目前语音交互服务一句话识别、录音文件识别支持以下地区和终端节点: 当前服务仅支持北京和上海区域,后续会陆续上线其他区域。 华北-北京四,推荐的区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。
是否必选 参数类型 描述 name 是 String 热词表名,不可重复。内容限制为字母,数字,下中划线和井号,长度不超过32字符。 description 否 String 热词表描述,长度不超过255字符。 language 是 String 热词表语言类型。 language取值
从Eclipse官网下载并安装Eclipse IDE for Java Developers最新版本,例如:eclipse-jee-mars-R-win32-x86_64.zip。 具体操作请参见配置Java环境章节。 新建SIS Java SDK工程。 解压eclipse后,直接打开。在主菜单选择“Window
r 函数 描述 void onTranscriptionConnect() webSocket连接建立后回调。 void onTranscriptionClose(); webSocket连接关闭后回调 void onTranscriptionFail(AsrResponse var1);
录音文件识别极速版接口 功能介绍 录音文件识别极速版接口,用于录音文件的同步识别。音频需要上传华为云OBS,提供华为云OBS对象地址,能快速返回识别结果。该接口的使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API