检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
语音合成接口 语音合成 SSML标记语言介绍
SDK简介 语音交互概述 语音交互服务(Speech Interaction Service,简称SIS)是一种人机交互方式,用户通过实时访问和调用API获取语音交互结果。支持用户通过语音识别功能,将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本,同时也支持通过语音
修订记录 发布日期 修订说明 2023-09-27 新增: iOS SDK新增一句话识别、实时语音识别连续模式 2023-03-06 新增: CPP SDK支持Linux版本 2022-08-02 新增: Java SDK新增实时语音合成 Python SDK新增实时语音合成 CPP
产品咨询类 什么是语音交互服务 支持哪些语言 语音合成后输出的音频格式是什么 是否支持离线使用 语音合成后能否返回播放时长 是否支持aac格式的语音文件转文字 如何查看当前接口是否免费调用
应用场景 语音客服质检 识别客服、客户的语音,转换为文本。进一步通过文本检索,检查有没有违规、敏感词、电话号码等信息。 会议记录 对会议记录的音频文件,进行快速的识别,转化成文字,方便进行会议记录。 语音短消息 通过语音发送或者接收短消息时,将音频短消息转文字,提升阅读效率和交互体验。
数据保护技术 在使用语音交互服务过程中委托我们处理的语音音频和文本等数据,您完全拥有上述数据所有权及控制权,您应自行对上述数据来源和获取的合法性负责,华为云受托处理您的数据,以实现本服务功能或目的: (1)将语音音频数据识别转换成文本。 (2)将文本数据合成语音。 您的上述数据将
的完善云服务安全保障体系。 安全性是华为云与您的共同责任,如图1所示。 华为云:负责云服务自身的安全,提供安全的云。华为云的安全责任在于保障其所提供的IaaS、PaaS和SaaS类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅
AK/SK认证 使用服务API需要进行认证,目前SDK仅支持AK/SK认证方式。 使用AK/SK方式,需要用户提供AK和SK。 注册并登录华为云管理控制台。 在控制台中,鼠标移动至右上角的用户名处,在下拉列表中单击“我的凭证”。 单击“访问密钥”页签,在页签中,单击“新增访问密钥”。
公共响应参数 公共响应参数如表 公共响应参数所示。 表1 公共响应参数 参数名 说明 Content-Length 响应消息体的字节长度,单位为Byte。 Date 系统响应的时间。 Content-type 发送的实体的MIME类型。 Upgrade 发送WebSocket握手
型。 请检查请求参数是否正确。 SIS.0302 内部服务异常。 请联系技术支持工程师。 SIS.0303 引擎连接失败。 请重试,多次出现请联系专业工程师。 SIS.0304 音频等待超时。 客户端长时间没有发送语音,服务端超过20s没有收到语音会产生该报错。 请减小数据发送间隔。
为什么录音文件识别出现重复转写结果 调用语音交互的API显示auth failed 调用语音交互的API超时怎么处理(connect timeout) 为什么服务端返回OBS链接不可用(data url is unreachable) 语音合成的base64编码如何使用 录音文件识别多久可以返回结果
查看监控指标 登录控制台。 在服务页面单击左侧的“总览”,进入“服务监控”页面。 图1 服务监控 父主题: 监控
SDK(新版) 推荐使用新版SDK语音交互服务SDK,该SDK基于统一规范开发,支持Java/Python/C++/.NET/Go/NodeJs/PHP,使用方法可参考API Explorer。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能,但该
示例音频 测试音频如表 示例音频所示,音频文件标题表示采样率和位宽。如8k16bit.pcm表示音频采样率为8k,位宽为16bit。 表1 示例音频 音频格式 下载链接 mp3 https://sis-sample-audio.obs.cn-north-1.myhuaweicloud
所有含英文的热词均需大写,如:Eiffel铁塔(正确示例为:EIFFEL铁塔)。 所有数字均用相应的汉字表示,避免使用阿拉伯数字 ,如:12345服务热线(正确示例为:一二三四五服务热线)。 热词内容仅包含英文和中文,避免出现标点符号、特殊字符或空格,如:。,?.*等。 尽量避免配置单音节的英文单词,避免误召回,如:MAY/TEE等。
统计API使用量 SIS控制台支持查看API的总调用量、调用成功量、调用失败量。 图1 总览
录音文件识别接口 提交录音文件识别任务 获取录音文件识别结果
如何续费 登录SIS服务控制台。 单击左侧导航栏“套餐包 > 续费管理”,进入“费用中心 > 订单管理 > 续费管理”页面。查看资源的到期时间并进行续费操作。 续费项列会展示全部云服务,请按照订购的资源包名称进行搜索。 图1 续费管理 父主题: 计费类
iOS SDK 一句话识别 实时语音识别连续模式
配置OBS访问权限 OBS服务 OBS全称Object Storage Service(对象存储服务),提供海量、安全、高可靠、低成本的数据存储能力,可供用户存储任意类型和大小的数据。 EI企业智能服务对于图片、语音等多媒体文件支持直接使用华为云OBS服务的数据处理方式,以减少服务使用成本,降