语音交互 服务(Speech Interaction Service,简称SIS)是一种人机交互方式,以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户通过实时访问和调用API获取语音交互结果。
使用前必读
用户需要具备编程能力,熟悉Java、Python等编程语言。
SIS服务需要用户通过调用API接口,将语音文件识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。
支持的语言
目前语音交互服务仅支持中文识别与合成。
首次使用SIS
如果您是首次使用SIS的用户,建议您学习并了解如下信息:
功能介绍
通过功能介绍章节的内容,了解SIS不同功能的具体介绍,主要包括定制 语音识别 (ASR Customization,ASRC)、实时语音转写(Real-time ASR,RASR)、语音识别(Automatic Speech Recognition,ASR)、 语音合成 (Text To Speech, TTS )、定制语音合成(Text To Speech Customization,TTSC)功能。
入门使用
SIS以开放API的方式提供给用户,您可以参考《快速入门》学习并使用SIS服务。
使用方式
如果您是一个开发工程师,熟悉代码编写,想要直接调用SIS的API或SDK使用服务,您可以参考《API参考》或《SDK参考》获取详情。
由浅入深学习
您可以参考成长地图,由浅入深学习使用SIS。