检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云服务之间的关系 如果多个云服务一起搭配使用,需要注意: 不同区域的弹性云服务器、关系型数据库、对象存储服务内网不互通。 不同区域的弹性云服务器不支持跨区域部署在同一负载均衡器下。 资源的价格 不同区域的资源价格可能有差异,请参见华为云服务价格详情。 如何选择可用区 是否将资源放在同一可用区
语音交互服务(Speech Interaction Service,简称SIS)是一种人机交互方式,用户通过实时访问和调用API获取语音交互结果。华为云SIS服务支持调用一句话识别、录音文件识别、实时语言识别、语音合成接口等。用户通过调用语音识别类接口,将口述音频、普通话或者带有一定方言的
认证和鉴权功能。 对象存储服务 SIS服务接口支持从对象存储服务(Object Storage Service,OBS)上采用临时授权和匿名公开授权的方式获取数据并进行处理。录音文件识别支持从OBS上采用授权的方式获取数据并进行处理。OBS更多信息请参见《对象存储服务产品介绍》。
提供管理控制台来检索SIS服务产生的监控指标和告警信息。 命名空间 SYS.SIS 监控指标 指标ID 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标) successful_calls_of_service 成功调用次数 统计周期内调用服务成功次数。 单位:次/分钟
一句话识别 http接口 websocket接口
准备环境 配置Java环境 配置Python环境 配置Android 环境 配置CPP环境(Windows) 配置CPP环境(Linux)
严重错误响应 功能介绍 严重错误,通常指流程无法继续的情况。出现严重错误响应时,流程不再继续,服务器端会主动断连。 响应消息 表1 响应参数 名称 参数类型 说明 resp_type String 响应类型。参数值为FATAL_ERROR,表示此次合成发生不可恢复的错误。 trace_id
语音合成接口 语音合成 SSML标记语言介绍
计费类 套餐包购买后是否支持退款 服务当前处于商用还是免费阶段 如何收费 如何续费 查看套餐用量明细、账单明细 账号中存在语音合成服务的套餐,但是为什么却收到了欠费的信息 欠费后充值账户,为什么调用SIS API仍返回'resource type is RESTRICTED' 欠费后套餐包能否继续使用
调用API或SDK 在线调试 本地调用
录音文件识别参数,音频文件以obs连接方式传入(即先需要将音频传送到华为云的obs) obs_url = '' # 音频obs连接 obs_audio_format = '' # 音频格式,如auto等,详见api文档 obs_property =
确保已按照配置Java环境配置完毕。 确保已存在待识别的音频文件并上传OBS或者有公网可访问服务器上(需保证可使用域名访问),示例音频可参考下载SDK压缩包文件。如果音频存放在OBS上,确保服务已授权访问OBS,可参考配置OBS服务。 请参考SDK(websocket)获取最新版本SDK包。
该接口用于提交录音文件识别任务,其中录音文件保存在用户的OBS桶中或公网可访问的服务器上(需保证可使用域名访问)。用户开通录音识别服务时,如果录音文件存放在OBS桶中,需授权录音文件引擎读取用户OBS桶权限,授权方法见配置OBS访问权限。该接口的使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。
开始识别请求响应 由于WebSocket是全双工的,因此响应就是从服务器端发送给客户端的消息,但也并不是所有的请求信息都有一条对应的响应。服务器端收到“开始识别”请求时,会给出如下响应消息,以json字符串形式放置在text message中。 响应消息 表1 响应参数 参数名 参数类型
约束与限制 实时语音识别 一句话识别 录音文件识别 语音合成 录音文件识别极速版
录音文件识别接口 提交录音文件识别任务 获取录音文件识别结果
修订记录 发布日期 修订说明 2023-09-27 新增: iOS SDK新增一句话识别、实时语音识别连续模式 2023-03-06 新增: CPP SDK支持Linux版本 2022-08-02 新增: Java SDK新增实时语音合成 Python SDK新增实时语音合成 CPP
实时语音合成响应 开始合成响应 语音合成结果响应 语音合成结束响应 语音合成错误响应 严重错误响应 父主题: 实时语音合成接口
结束识别请求响应 服务器端收到“结束识别”请求时或语音识别过程中发生错误,服务端会向客户端推送如下响应消息,以json字符串形式放置在text message中。 响应消息 表1 响应参数 参数名 参数类型 说明 resp_type String 响应类型。参数值为END,表示结束识别响应。
iOS SDK 一句话识别 实时语音识别连续模式