检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
语音服务收费是按照调用接口的次数或者时长来计算费用,详细收费明细请参见价格计算器。 支持两种计费方式: 按需计费,默认计费方式为“按需计费”。 折扣套餐包方式,是用户可以购买套餐包,扣费时调用次数会先在套餐包内进行抵扣,抵扣完后的剩余调用量默认转回按需计费方式。 父主题: 计费类
统一身份认证服务 统一身份认证(Identity and Access Management,简称IAM)服务,IAM为语音交互服务提供了用户认证和鉴权功能。 对象存储服务 SIS服务接口支持从对象存储服务(Object Storage Service,OBS)上采用临时授权和匿
语音合成后输出的音频格式是什么 语音合成后返回一组Base64编码格式的语音数据,用户需要用编程语言或者sdk将返回的Base64编码格式的数据解码成byte数组,再保存为wav格式的音频。 语音合成(Text To Speech ,TTS服务)服务的音频格式则根据接口中audi
示例音频所示,音频文件标题表示采样率和位宽。如8k16bit.pcm表示音频采样率为8k,位宽为16bit。 表1 示例音频 音频格式 下载链接 mp3 https://sis-sample-audio.obs.cn-north-1.myhuaweicloud.com/16k16bit
示例音频所示,音频文件标题表示采样率和位宽。如8k16bit.pcm表示音频采样率为8k,位宽为16bit。 表1 示例音频 音频格式 下载链接 mp3 https://sis-sample-audio.obs.cn-north-1.myhuaweicloud.com/16k16bit
将游戏娱乐中的语音聊天转成文字消息,提升用户阅读效率,提升用户体验。 有声读物 将书籍、杂志、新闻的文本内容转换成逼真的人声发音,充分解放人们的眼睛,在搭乘地铁、开车、健身等场景下获取信息、享受乐趣。 电话回访 在客服系统场景中,通过将回访内容转换成人声,直接使用语音和客户交流,提升用户体验。 智能教育
支持wav、mp3、m4a、acc、opus格式音频文件。 语音时长不超过120分钟,文件大小不超过100M。 支持从华为云对象存储服务(OBS)下载音频,需要用户提供OBS桶名和对象键值。 父主题: 约束与限制
数或者时长来计算费用,具体计费价格参见语音交互价格计算器。 支持两种计费方式: 按需计费,默认计费方式为“按需计费”。 折扣套餐包方式,是用户可以购买套餐包,扣费时调用次数会先在套餐包内进行抵扣,抵扣完后的剩余调用量默认转回按需计费方式。 父主题: 使用前必读
-opus、AMR等多种格式,详见API参考文档中的“audio_format取值范围”。 语音时长不超过5小时,文件大小不超过300M,用户的识别任务在6小时内完成并返回识别结果,识别结果保存72小时(从转写完成的时间算起)。 支持中文普通话、四川话识别。 父主题: 约束与限制
reason String 结束原因,详情请参见表 结束原因表。 表2 结束原因表 参数名 说明 NORMAL 正常结束。 CANCEL 用户取消,也即客户端发送“结束识别”指令时cancel参数为true。 ERROR 识别过程中发生错误。 示例 { "resp_type":
zip解压之后,使用idea打开该工程,根据指示,修改相关信息即可运行demo(目前该SDK仅支持在Android8 及以上版本系统中使用,推荐使用真机进行调试)。 用户可将libs目录中的huaweicloud-android-sdk-sis-1.1.0.jar,集成到自己的项目中进行开发(demo仅用于指示作用)。
项目编号。获取方法,请参见获取项目ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 用于获取操作API的权限。获取方法请参见认证鉴权。响应消息头中X-Subject-Token的值即为Token。 响应参数 状态码:
SIS支持HTTPS、WebScoket传输协议,采用华为云官网标准网关,数据传输过程有全链路安全保障。 数据存储 华为云SIS承诺数据不落盘,用户的原始文本和音频结果数据均不作保留,识别返回后立即释放。 服务声明请参见:https://www.huaweicloud.com/declaration/sis
Sec-WebSocket-Version 发送WebSocket握手请求时,包含该头域。 标识了客户端支持WebSocket协议的版本。 13 X-Auth-Token 是 用户Token。 MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG
调用热词接口,不单独计费。 计费模式 按需计费 按需计费是指按照API调用次数阶梯价格计费,计费价格参见语音交互价格计算器。 折扣套餐包 折扣套餐包方式是用户可以购买套餐包,扣费时调用次数会先在套餐包内进行抵扣,抵扣完后的剩余调用量默认转回按需计费方式,计费价格参见语音交互价格计算器。 图1 购买套餐包
等。热词不建议太长,也不要有标点符号或者特殊符号。具体限制参见创建热词表更新热词表章节。 功能介绍 新建一个热词表,创建成功返回id。每个用户限制创建100个热词表。 调用热词时,需确保调用热词的区域与创建热词的区域一致。如下图位置可查询创建热词所在区域: 图1 热词创建区域查询
String 被删除的热词表id。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 用于获取操作API的权限。获取方法请参见认证鉴权。响应消息头中X-Subject-Token的值即为Token。 响应参数
只会返回最多一组VOICE_START和VOICE_END事件。 如果返回EXCEEDED_SILENCE事件,表示超过vad_head没有检测到声音,通常表示用户一直没有说话。此时后续的音频将被忽略,不会再进行识别。 在实时语音识别连续模式下: 不会返回VOICE_START、VOICE_END、EXCEED_SLIENCE事件。
hInfo,详见表1。 表1 AuthInfo 参数名称 是否必选 参数类型 描述 ak 是 String 用户的ak,可参考AK/SK认证。 sk 是 String 用户的sk,可参考AK/SK认证。 region 是 String 区域,如cn-north-4,参考终端节点。
初始化RttsClient,其参数包括AuthInfo 表1 AuthInfo 参数名称 是否必选 参数类型 描述 ak 是 String 用户的ak,可参考AK/SK认证。 sk 是 String 用户的sk,可参考AK/SK认证。 projectId 是 String 项目ID,同region一一对应,参考获取项目ID。