检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
产品咨询类 什么是语音交互服务 支持哪些语言 语音合成后输出的音频格式是什么 是否支持离线使用 语音合成后能否返回播放时长 是否支持aac格式的语音文件转文字 如何查看当前接口是否免费调用
产品优势 多语种多音色 中文普通话、男声、女声、童声自由切换,可以调整音量,语速。 效果出色 文本转换自然清晰,近乎真人发音,能够符合多样的应用场景。
父主题: 产品咨询类
安全 责任共担 身份认证与访问控制 数据保护技术 服务韧性 监控安全风险
父主题: 产品咨询类
若欠费前已调用对应接口,则默认开通该接口,欠费后可继续使用至账户被华为云账户中心冻结为止。冻结由账户中心控制,一般情况下套餐包未使用完不会被冻结。
支持从华为云对象存储服务(OBS)下载音频,需要用户提供OBS桶名和对象键值。 父主题: 约束与限制
录音文件识别接口 提交录音文件识别任务 获取录音文件识别结果
服务韧性 SIS提供三级可靠性架构,通过AZ之间容灾、AZ内实例冗余、实例健康检测等技术方案,保障服务的可靠性。 父主题: 安全
pcm16k16bit、pcm8k16bit、ulaw16k8bit、ulaw8k8bit、alaw16k8bit、alaw8k8bit、WAV(支持pcm/ulaw/alaw/adpcm编码格式)、MP3、M4A、ogg-speex、ogg-opus、AMR等多种格式,详见API参考文档中的
表1 SIS的数据保护手段和特性 数据保护手段 说明 传输加密 SIS支持HTTPS、WebScoket传输协议,采用华为云官网标准网关,数据传输过程有全链路安全保障。 数据存储 华为云SIS承诺数据不落盘,用户的原始文本和音频结果数据均不作保留,识别返回后立即释放。
约束与限制 实时语音识别 一句话识别 录音文件识别 语音合成 录音文件识别极速版
OBS更多信息请参见《对象存储服务产品介绍》。
什么是语音交互服务 语音交互服务(Speech Interaction Service,简称SIS)是一种人机交互方式,用户通过实时访问和调用API获取语音交互结果。例如用户通过语音识别功能,将口述音频或者语音文件识别成可编辑的文本,同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验
应用场景 语音客服质检 识别客服、客户的语音,转换为文本。进一步通过文本检索,检查有没有违规、敏感词、电话号码等信息。 会议记录 对会议记录的音频文件,进行快速的识别,转化成文字,方便进行会议记录。 语音短消息 通过语音发送或者接收短消息时,将音频短消息转文字,提升阅读效率和交互体验
监控 语音交互服务的监控指标 查看监控指标
身份认证与访问控制 身份认证 用户访问SIS的方式有多种,包括SIS控制台、API、SDK,无论访问方式封装成何种形式,其本质都是通过SIS提供的API接口进行请求。 SIS的接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 Token认证:通过Token认证调用请求。 AK
查看监控指标 登录控制台。 在服务页面单击左侧的“总览”,进入“服务监控”页面。 图1 服务监控 父主题: 监控
监控安全风险 SIS提供基于云监控服务CES的监控能力,帮助用户监控账号下的SIS服务API,执行自动实时监控、告警和通知操作。用户可以实时掌握API所产生的调用成功次数、调用失败次数等信息。 关于SIS支持的监控指标,以及如何创建监控告警规则等内容,请参见语音交互服务的监控指标。
安全性是华为云与您的共同责任,如图1所示。 华为云:负责云服务自身的安全,提供安全的云。华为云的安全责任在于保障其所提供的IaaS、PaaS和SaaS类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。