检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
16k16bit单通道录音数据。 pcm8k16bit 8k16bit单通道录音数据。 ulaw16k8bit 16k8bit ulaw单通道录音数据。 ulaw8k8bit 8k8bit ulaw单通道录音数据。 alaw16k8bit 16k8bit alaw单通道录音数据。 alaw8k8bit
format is invalid!" 解决方案 确保设置的audio_format格式的值是合法,即设置的格式是表1中的格式。 确保待识别音频的格式和接口参数中设置的audio_format参数格式一致。 表1 录音文件识别支持的音频格式 audioformat取值 说明 auto
ulaw三种编码格式。 amr AMR窄带(8k) 压缩录音数据。目前仅支持单通道的音频。 amrwb AMR 宽带(16k) 压缩录音数据。目前仅支持单通道的音频。 auto 由引擎自动判断音频数据的格式并解码,支持自动判断amr,flac,m4a,mp3,ogg,webm,wav,aac,
为什么录音文件识别出现重复转写结果 调用语音交互的API显示auth failed 调用语音交互的API超时怎么处理(connect timeout) 为什么服务端返回OBS链接不可用(data url is unreachable) 语音合成的base64编码如何使用 录音文件识别多久可以返回结果
config数据结构。 表2 config数据结构 参数 是否必选 参数类型 说明 audio_format 是 String 支持语音的格式,请参见表 audio_format取值范围。 property 是 String 所使用的模型特征串。通常是 “语种_采样率_领域”的形式,例
SDK)是对语音交互服务提供的REST API进行的封装,用户直接调用语音交互SDK提供的接口函数即可实现使用语音交互业务能力的目的,以简化用户的开发工作。SIS SDK目前支持Java和Python。 本章节提供了通过Java SDK调用一句话识别服务的样例,帮助用户快速了解如何使用Java
SasrWebsocketClient初始化参数 参数名称 是否必选 参数类型 描述 ak 是 String 用户的ak,请参考AK/SK认证。 sk 是 String 用户的sk,请参考AK/SK认证。 use_aksk 是 Boolean 使用ak、sk要填写true。 region
将下载的 huaweicloud-android-sdk-sis-1.1.0.zip解压之后,使用idea打开该工程,根据指示,修改相关信息即可运行demo(目前该SDK仅支持在Android8 及以上版本系统中使用,推荐使用真机进行调试)。 用户可将libs目录中的huawe
Python SDK包,并进行解压缩。 PyCharm中导入SIS Python SDK。 在PyCharm中新建一个项目,打开解压后的SDK包。 修改代码中的认证信息,并填写待合成文本。 表1 参数说明 参数名称 描述 ak、sk 登录访问密钥界面,选择“管理访问密钥 > 新增访问密钥
安全 责任共担 身份认证与访问控制 数据保护技术 服务韧性 监控安全风险
其中,基于WebSocket协议进行实时语音识别时,需要客户端首先发送转写开始消息,然后持续发送语音数据至服务端,最后发送结束消息,在此期间客户端会持续收到服务端发送的转写结果或事件,客户端根据所收到的响应消息做对应处理。实时语音识别接口的具体细节请参见接口说明章节。 图1 客户端与服务端交流流程
RasrClient初始化参数。 表1 RasrClient初始化参数 参数名称 是否必选 参数类型 描述 ak 是 String 用户的ak,请参考AK/SK认证。 sk 是 String 用户的sk,请参考AK/SK认证。 use_aksk 是 Boolean 使用ak、sk要填写true。 region
er。其中AuthInfo和SisHttpConfig的参数如表1所示。 表1 AuthInfo 参数名称 是否必选 参数类型 描述 ak 是 String 用户的ak,可参考AK/SK认证。 sk 是 String 用户的sk,可参考AK/SK认证。 serviceRegion
三种模式。 三种模式的握手请求wss-URI不同,基于Websocket承载的实时语音识别请求和响应的消息格式相同。 开发者可以使用java、python、c++等开发语言支持Websocket的对应软件包或库接口,与实时语音识别引擎握手连接,并发送语音数据和接收转写结果,最后关闭Websocket连接。
面向公共租户提供通用云服务的Region;专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region。 详情请参见区域和可用区。 可用区(AZ,Availability Zone) 一个AZ是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计
语音合成结果响应 音频流数据 时间戳数据 父主题: 实时语音合成响应
Key)加密调用请求。经过认证的请求总是需要包含一个签名值,该签名值以请求者的访问密钥(AK/SK)作为加密因子,结合请求体携带的特定信息计算而成。通过访问密钥(AK/SK)认证方式进行认证鉴权,即使用Access Key ID(AK)/Secret Access Key(SK)加密的方法来验证某
错误响应,通常是指不影响流程,但当前会话无法再进行下去的错误,包括如下情况: 配置串错误,包括存在不识别的配置串,或者配置串值的范围不合法。 时序不正确,比如连续发送两次“开始识别”指令。 识别过程中发生错误,比如音频解码发生错误。 出现错误响应时,如果已经在一个会话中了,会再发送一个“结束识别”的响应,表示识别会话
/v1/{project_id}/tts 表2 WebSocket API功能 接口 功能 API URI 实时语音识别接口(请求) 开始识别 支持三种模式的请求消息: 流式一句话 WSS /v1/{project_id}/rasr/short-stream 实时语音识别连续模式 WSS /v1/
或时长。 购买的套餐包在生效期内,扣费方式是先扣除已购买的套餐包内的额度后,超出部分以按需计费的方式进行结算。 购买的套餐包到期后如果没有购买新的套餐包,系统会自动转为按需计费。 变更配置 SIS默认使用按需计费。您也可以根据您的实际情况购买资源包,购买后对应区域的资源将自动转为