搜索_华为云

为什么服务端返回OBS链接不可用（data url is unreachable） - 语音交互服务 SIS

检查存放音频的OBS的Region和服务的Region是否为同一区域，只有同一区域的OBS才能正常访问。检查音频的OBS URI是否正确。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
发送音频数据 - 语音交互服务 SIS

发送音频数据在收到“开始识别”的响应之后，可以开始发送音频数据。为节省流量，音频以二进制数据帧形式（binary message）的方式发送。音频数据将分片发送，也即在获得一定量音频数据的同时就可以发送一个binary message，每个分片建议在50ms~1000ms之间

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
SIS.0032报错 - 语音交互服务 SIS
SIS.0032报错 - 语音交互服务 SIS

SIS.0032报错问题描述为何调用一句话识别的api接口，返回错误码"SIS.0032"，错误信息为:"'audio_format' is invalid"？解决方案确保设置的audio_format格式的值是合法，待识别的音频格式和audio_format参数格式要保证一致。

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频语音合成接口当前仅支持单声道，不支持返回立体音（双声道）格式的音频。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
Token消息体中user name，domain name和project name分别指的是什么 - 语音交互服务 SIS

name和domain name不相同，user name为实际的用户名称。 project name指项目名称，如“cn-north-4”。。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别工作流程实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。开始阶段需要发送开始指令，包含采样率，音频格式，是否返回中间结果等配置信息。服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
一句话识别Websocket接口 - 语音交互服务 SIS

请参考表7。表7 Result 参数名参数类型说明 text String 识别结果。 score Float 识别结果的置信度，取值范围：0~1。此值仅会在最终结果时被赋值，在中间结果时统一置为“0.0”。说明：目前置信度作用不是太大，请勿过多依赖此值。 word_info

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
音频流数据 - 语音交互服务 SIS

音频流数据功能介绍分多段返回二进制语音数据流，如果用户未设置语音格式，则默认返回pcm格式语音。父主题：语音合成结果响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
服务当前处于商用还是免费阶段 - 语音交互服务 SIS

服务当前处于商用还是免费阶段当前语音交互服务在中国区已全部商用，使用该服务需要收费。详细的接口费用说明请参见计费说明。父主题：计费类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 计费类
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

保存音频的本地路径，只有在请求时saved参数设置为true才生效。表5 Result 参数名称是否必选参数类型说明 data 是 String 合成后生成的语音数据，以Base64编码格式返回。代码示例如下示例仅供参考，最新代码请前往SDK（websocket）章节获取并运行。 # -*-

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
调用Java SDK实现一句话识别 - 语音交互服务 SIS

jar、slf4j-api-1.7.21.jar、slf4j-log4j12-1.7.5.jar。新版本需要将其替换成log4j-api-2.12.0.jar、log4j-core-2.12.0.jar、log4j-slf4j-impl-2.12.0.jar、slf4j-api-1.7.30

帮助中心 > 语音交互服务 SIS > 快速入门
一句话识别 - 语音交互服务 SIS

data 是 String 本地音频文件经过Base64编码后的字符串，音频文件时长小于60s。表3 Config 参数名称是否必选参数类型描述 audioFormat 是 String 音频格式，具体信息请参见《API参考》中一句话识别章节。 property 是 String

帮助中心 > 语音交互服务 SIS > SDK参考 > iOS SDK
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

调用成功时为合成语音内容，请参考表5。调用失败时无此字段。表5 Result 参数名是否必选参数类型说明 data 是 String 合成后生成的语音数据，以Base64编码格式返回。用户如需生成音频，需要将Base64编码解码成byte数组，再保存为wav音频。代码示例如下示例仅供参考，最新代码

 帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
功能介绍 - 语音交互服务 SIS
功能介绍 - 语音交互服务 SIS

功能介绍实时语音识别实时语音识别服务，用户通过实时访问和调用API获取实时语音识别结果，支持的语言包含中文普通话、方言和英语，方言当前支持四川话、粤语和上海话。文本时间戳为音频转换结果生成特定的时间戳，从而通过搜索文本即可快速找到对应的原始音频。智能断句通过提取上下文

 帮助中心 > 语音交互服务 SIS > 产品介绍
实时语音识别连续模式 - 语音交互服务 SIS

音频格式，SDK内置录音功能只支持pcm16k16bit，参见《API参考》中开始识别章节。 property 是 String 属性字符串，language_sampleRate_domain，如chinese_16k_general，参见《API参考》中开始识别章节。 addPunc 否 String

帮助中心 > 语音交互服务 SIS > SDK参考 > iOS SDK
语音交互服务使用简介 - 语音交互服务 SIS

式，用户通过实时访问和调用API获取语音交互结果。华为云SIS服务支持调用一句话识别、录音文件识别、实时语言识别、语音合成接口等。用户通过调用语音识别类接口，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过调用语音合成接口将文本转换成逼真的语音等。适

 帮助中心 > 语音交互服务 SIS > 快速入门
什么是语音交互服务 - 语音交互服务 SIS

使用前必读用户需要具备编程能力，熟悉Java、Python、IOS等编程语言。用户通过调用API接口，将语音文件识别成可编辑的文本，然后返回JSON格式的识别结果，用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。首次使用SIS 如果您是首次使用SIS的用户，建议您学习并了解如下信息：

帮助中心 > 语音交互服务 SIS > 产品介绍
一句话识别Websocket接口 - 语音交互服务 SIS

音频支持格式，如pcm16k16bit，详见api文档 property = '' # 属性字符串，language_sampleRate_domain, 如chinese_16k_common, 采样率要和音频一致。详见api文档 class MyCallback(RasrCallBack):

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
录音文件识别 - 语音交互服务 SIS

例如wav音频，格式是auto。具体参考api文档。例如音频是pcm格式，并且采样率为8k，则格式填写pcm8k16bit。如果返回audio_format is invalid 说明该文件格式不支持。具体支持哪些音频格式，需要参考一些api文档。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
SIS.0535报错 - 语音交互服务 SIS
SIS.0535报错 - 语音交互服务 SIS

式。确保待识别音频的格式和接口参数中设置的audio_format参数格式一致。表1 录音文件识别支持的音频格式 audioformat取值说明 auto 自动判断，系统会自动判断并支持WAV（内部支持pcm/ulaw/alaw/adpcm编码格式）、MP3、M4A、ogg

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类

总条数： 192

上一页
1
...
6
7
8
9
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么服务端返回OBS链接不可用（data url is unreachable） - 语音交互服务 SIS

发送音频数据 - 语音交互服务 SIS

SIS.0032报错 - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

Token消息体中user name，domain name和project name分别指的是什么 - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

一句话识别Websocket接口 - 语音交互服务 SIS

音频流数据 - 语音交互服务 SIS

服务当前处于商用还是免费阶段 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

调用Java SDK实现一句话识别 - 语音交互服务 SIS

一句话识别 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

功能介绍 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

语音交互服务使用简介 - 语音交互服务 SIS

什么是语音交互服务 - 语音交互服务 SIS

一句话识别Websocket接口 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

SIS.0535报错 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线