检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何收费 语音服务收费是按照调用接口的次数或者时长来计算费用,详细收费明细请参见价格计算器。 支持两种计费方式: 按需计费,默认计费方式为“按需计费”。 折扣套餐包方式,是用户可以购买套餐包,扣费时调用次数会先在套餐包内进行抵扣,抵扣完后的剩余调用量默认转回按需计费方式。 父主题:
安全 责任共担 身份认证与访问控制 数据保护技术 服务韧性 监控安全风险
计费类 套餐包购买后是否支持退款 服务当前处于商用还是免费阶段 如何收费 如何续费 查看套餐用量明细、账单明细 账号中存在语音合成服务的套餐,但是为什么却收到了欠费的信息 欠费后充值账户,为什么调用SIS API仍返回'resource type is RESTRICTED' 欠费后套餐包能否继续使用
约束与限制 实时语音识别 一句话识别 录音文件识别 语音合成 录音文件识别极速版
准备环境 配置Java环境 配置Python环境 配置Android 环境 配置CPP环境(Windows) 配置CPP环境(Linux)
准备数据 数据要求 受技术与成本多种因素制约,SIS服务存在一些约束限制。详情请参考产品介绍中的约束与限制章节。
附录 示例音频 获取项目ID 获取账号ID 获取AK/SK 公共请求参数 公共响应参数 状态码 错误码 配置OBS访问权限
附录 示例音频
功能体验与试用 语音交互服务(Speech Interaction Service,SIS)支持语音识别、语音合成功能。适用语音客服质检、会议记录、语音短消息、有声读物、电话回访等场景。 在使用服务前,请先使用SIS体验中心体验服务功能。该方式无需编程,只需在网页端上传文字或音频,即可体验合成效果。
SDK简介 语音交互概述 语音交互服务(Speech Interaction Service,简称SIS)是一种人机交互方式,用户通过实时访问和调用API获取语音交互结果。支持用户通过语音识别功能,将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本,同时也支持通过语音
修订记录 发布日期 修订说明 2023-09-27 新增: iOS SDK新增一句话识别、实时语音识别连续模式 2023-03-06 新增: CPP SDK支持Linux版本 2022-08-02 新增: Java SDK新增实时语音合成 Python SDK新增实时语音合成 CPP
API概览 SIS服务提供了两种接口,包含REST(Representational State Transfer)API,支持您通过HTTPS请求调用,请参见表1。也包含WebSocket接口,支持Websocket协议,请参见表2。 表1 REST API功能 接口 功能 API
功能介绍 实时语音识别 实时语音识别服务,用户通过实时访问和调用API获取实时语音识别结果,支持的语言包含中文普通话、方言和英语,方言当前支持四川话、粤语和上海话。 文本时间戳 为音频转换结果生成特定的时间戳,从而通过搜索文本即可快速找到对应的原始音频。 智能断句 通过提取上下文
进行扣费,就会导致欠费,SIS服务因不涉及物理实体资源,无宽限期。欠费后继续调用会导致冻结,直接进入保留期,保留期按需资源不可调用。您续费后可继续正常使用,请注意在保留期进行的续费,是以原到期时间作为生效时间,您应当支付从进入保留期开始到续费时的服务费用。 您账号欠费后,会导致部
使用流程简介 用户通过调用SIS服务提供的API或SDK,进行语音转文本或语音合成任务,返回的结果需要您通过编码对接到业务系统中。 图1 使用流程
部署类 语音交互服务是否支持私有化部署
权限类 语音交互服务需要申请什么权限 如何通过主账号创建一个子账号 语音识别是强制绑定使用OBS进行录音文件存储吗
所有含英文的热词均需大写,如:Eiffel铁塔(正确示例为:EIFFEL铁塔)。 所有数字均用相应的汉字表示,避免使用阿拉伯数字 ,如:12345服务热线(正确示例为:一二三四五服务热线)。 热词内容仅包含英文和中文,避免出现标点符号、特殊字符或空格,如:。,?.*等。 尽量避免配置单音节的英文单词,避免误召回,如:MAY/TEE等。
统计API使用量 SIS控制台支持查看API的总调用量、调用成功量、调用失败量。 图1 总览
语音合成接口 语音合成 SSML标记语言介绍