检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
SDK简介 语音交互概述 语音交互服务(Speech Interaction Service,简称SIS)是一种人机交互方式,用户通过实时访问和调用API获取语音交互结果。
用户通过实时访问和调用API获取语音合成结果,将用户输入的文字合成为音频。通过音色选择、自定义音量、语速,为企业和个人提供个性化的发音服务。该接口的使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。
语音交互服务使用简介 语音交互服务(Speech Interaction Service,简称SIS)是一种人机交互方式,用户通过实时访问和调用API获取语音交互结果。华为云SIS服务支持调用一句话识别、录音文件识别、实时语言识别、语音合成接口等。
功能介绍 实时语音识别 实时语音识别服务,用户通过实时访问和调用API获取实时语音识别结果,支持的语言包含中文普通话、方言和英语,方言当前支持四川话、粤语和上海话。 文本时间戳 为音频转换结果生成特定的时间戳,从而通过搜索文本即可快速找到对应的原始音频。
resource-path 资源路径,即API访问路径。从具体API的URI模块获取,例如“一句话识别”API的resource-path为的“/v1/{project_id}/asr/short-audio”。
为保证网络的连通性,降低网络时延、提高访问速度,请选择靠近您客户的区域,当前语音服务支持北京和上海区域,后续会陆续上线其他区域,当前支持的区域请参见地区与终端节点。 华北-北京四,为推荐的区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。
如果您的华为云账号已升级为华为账号,将不支持获取Token。建议为您自己创建一个IAM用户,获取IAM用户的Token。详细说明请参见账密报错“The username or password is wrong.”。
开始识别 功能介绍 当wss握手请求收到成功响应后,客户端到服务端的通信协议会升级为Websocket协议。通过Websocket协议,客户端发送开始识别请求,用于配置实时语音识别的配置信息。
project name:表示服务部署区域名,如在本示例中服务部署区域为cn-north-4,详细介绍请参见终端节点。 获取Token时,如果出现账密报错The username or password is wrong,请参见常见问题解决。
单击“访问密钥”。 单击“新增访问密钥”。 依据界面提示,获取并下载秘钥,请妥善保管。 图2 获取访问秘钥 父主题: 附录
表1 参数说明 参数名称 描述 ak、sk 登录访问密钥界面,选择“管理访问密钥 > 新增访问密钥”获取。访问密钥为credentials.csv文件,包含AK/SK信息。 region 部署区域,如:cn-north-4。具体请参考终端节点。
AK(Access Key ID):访问密钥ID。与私有访问密钥关联的唯一标识符;访问密钥ID和私有访问密钥一起使用,对请求进行加密签名。 SK(Secret Access Key):与访问密钥ID结合使用的密钥,对请求进行加密签名,可标识发送方,并防止请求被修改。
安全 责任共担 身份认证与访问控制 数据保护技术 服务韧性 监控安全风险
附录 示例音频 获取项目ID 获取账号ID 获取AK/SK 公共请求参数 公共响应参数 状态码 错误码 配置OBS访问权限
客户端通过Websocket协议访问实时流转写接口时,连接时长不能超过5小时。超过5小时的Websocket连接,服务端会自动断链。 父主题: 实时语音识别接口
请检查OBS上音频是否可访问。权限配置方法请参见配置OBS访问权限。 SIS.30004 下载热词文件失败。 请检查热词是否存在。 SIS.30006 音频解码失败。 请检查音频格式是否正常,音频是否是空文件。 SIS.30007 转写引擎加载热词失败。 请检查热词是否存在。
2022-02-15 新增: 录音文件识别输入参数兼容公网访问的url。
AK/SK即访问秘钥,请登录“我的凭证”界面,选择“管理访问密钥 > 新增访问密钥”获取。 AK/SK认证鉴权,配置Java SDK中的AK/SK。 根据获取的AK/SK,修改Demo工程“AsrCustomizationDemo.java”文件中函数的“AK”和“SK”的值。
选择区域时,您需要考虑以下几个因素: 地理位置 一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。
obs_bucket_name 是 String 表示在OBS对象桶名,使用前请先授权配置请参见配置OBS访问权限。obs_bucket_name字符长度区间为[3,64),需要进行urlencode编码。 OBS桶区域需要与接口的地址区域一致。