检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
6k8bit、alaw8k8bit、WAV(支持pcm/ulaw/alaw/adpcm编码格式)、MP3、M4A、ogg-speex、ogg-opus、AMR等多种格式,详见API参考文档中的“audio_format取值范围”。 语音时长不超过5小时,文件大小不超过300M,用
用户需要具备编程能力,熟悉Java、Python、IOS等编程语言。 用户通过调用API接口,将语音文件识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 首次使用SIS 如果您是首次使用SIS的用户,建议您学习并了解如下信息:
如何收费 如何续费 查看套餐用量明细、账单明细 账号中存在语音合成服务的套餐,但是为什么却收到了欠费的信息 欠费后充值账户,为什么调用SIS API仍返回'resource type is RESTRICTED' 欠费后套餐包能否继续使用
约束与限制 实时语音识别 一句话识别 录音文件识别 语音合成 录音文件识别极速版
准备环境 配置Java环境 配置Python环境 配置Android 环境 配置CPP环境(Windows) 配置CPP环境(Linux)
iOS SDK 一句话识别 实时语音识别连续模式
企业项目管理 应用场景简介 创建企业项目 企业项目财务管理
部署类 语音交互服务是否支持私有化部署
权限类 语音交互服务需要申请什么权限 如何通过主账号创建一个子账号 语音识别是强制绑定使用OBS进行录音文件存储吗
SDK使用类 Java SDK是否支持使用Maven导入 SDK支持哪些语言
安全 责任共担 身份认证与访问控制 数据保护技术 服务韧性 监控安全风险
附录 示例音频
例如音频是pcm格式,并且采样率为8k,则格式填写pcm8k16bit。 如果返回audio_format is invalid 说明该文件格式不支持。具体支持哪些音频格式,需要参考一些api文档。 2. 音频采样率要与属性字符串的采样率要匹配。
区域与可用区 什么是区域与可用区 语音交互服务的区域如何选择
错误码类 SIS.0304报错 SIS.0103报错 SIS.0032报错 SIS.0535报错 APIG.0101报错 APIG.0201报错 APIG.0301报错 账密报错“The username or password is wrong.” Token与Project ID不匹配报错
服务声明类 如何查看SIS服务声明
监控 语音交互服务的监控指标 查看监控指标
CPP SDK(Windows) 使用实时语音识别 使用实时语音合成
Android SDK 一句话识别(http版) 一句话识别(websocket版) 实时语音识别连续模式 语音合成(http版) 语音合成(webSocket版)