检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
d}}/rasr/short-stream' # endpoint和project_id需替换 audio_path = '音频路径' token = '用户对应region的token' header = { 'X-Auth-Token':
/rasr/continue-stream' # endpoint和project_id需替换 audio_path = '音频路径' token = '用户对应region的token' header = { 'X-Auth-Token':
Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST /v1/{project_id}/tts 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目编号。获取方法,请参见获取项目ID。 请求参数 表2 请求Header参数
所属区域”,从“项目ID”列获取子项目ID。 private String path = ""; // 本地音频路径,如D:/test.wav, 也可将音频文件、音频流转换为byte数组后进行传送。 private String audioFormat
// 待合成的文本 private String path = ""; // 合成音频存储的路径 public static void main(String[] args) { RttsDemo rttsDemo =
com/api-sis/sis_03_0008.html private String path = ""; // 本地音频路径,如D:/test.wav, sdk也支持byte数组传送 private String audioFormat = "pcm16k16bit";
error!报错请检查数据格式或编码格式是否符合要求。 asr data url param is invalid报错,请使用存放在OBS的音频文件路径,并确保OBS的region要和请求服务的region保持一致。 SIS.0535 录音文件识请求的文件类型不支持。 确保设置的audio
no,默认为yes。 vad_head 否 Integer 一段音频的开头,当它的静音持续时间大于等于此值时,在实时语音识别单句模式下将返回“长时间静音”事件并结束识别,在连续模式下将会断句并继续下一句的识别。 如果设置为0,表示不检测“长时间静音”情况。 取值范围:[0, 60000]的整数,单
目前,华为云已在全球多个地域开放云服务,您可以根据需求选择适合自己的区域和可用区。 如何选择区域? 选择区域时,您需要考虑以下几个因素: 地理位置 一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。不过,在基础设施、BGP网络品质、资源的操作与配置等方面,中
响应示例如下,例如,语音交互服务部署的区域为“cn-north-4”,响应消息体中查找“name”为“cn-north-4”,其中projects下的“id”即为项目ID。 { "projects": [ { "domain_id":
响应类型。参数值为ERROR,表示错误响应。 trace_id String 服务内部的跟踪令牌,可用于在日志中追溯具体流程。 在某些错误情况下,可能没有此字段。 error_code String 错误码列表。详细错误码解释,请参见错误码。 error_msg String 返回错误信息。
用户阅读效率,提升用户体验。 有声读物 将书籍、杂志、新闻的文本内容转换成逼真的人声发音,充分解放人们的眼睛,在搭乘地铁、开车、健身等场景下获取信息、享受乐趣。 电话回访 在客服系统场景中,通过将回访内容转换成人声,直接使用语音和客户交流,提升用户体验。 智能教育 集成语音合成的
论是否有套餐包剩余。若欠费前已调用对应接口,则默认开通该接口,欠费后可继续使用至账户被华为云账户中心冻结为止。冻结由账户中心控制,一般情况下套餐包未使用完不会被冻结。 不可重置且不是续期购买套餐包方式的API接口,例如“一句话识别1万次套餐包”,在欠费后如果套餐包有剩余,可继续使用,但不可购买,也不可续期。
是创建用户并使用他们进行日常管理工作。 用户 由账号在IAM中创建的用户,是云服务的使用人员,具有身份凭证(密码和访问密钥)。 在我的凭证下,您可以查看账号ID和用户ID。通常在调用API的鉴权过程中,您需要用到账号、用户和密码等信息。 区域(Region) 从地理位置和网络时延
返回识别的结果。 void onVoiceStart(); 单句模式下,响应VOICE_START事件,表示检测到语音,此时IVR可以做打断(连续模式可忽略)。 void onVoiceEnd(); 单句模式下,响应VOICE_END事件,表示一句话结束,后续的音频将被忽略,不会再进行识别(连续模式可忽略)。
音频数据将分片发送,也即在获得一定量音频数据的同时就可以发送一个binary message,每个分片建议在50ms~1000ms之间,建议在需要实时反馈的情况下100ms,不需要实时反馈的情况下500ms。 结束识别 功能介绍 对于识别中的对话,需要在Websocket上发送“结束识别”的请求来取消或结束识别。 "
是否必选 参数类型 说明 traceId 是 String 服务内部的令牌,可用于在日志中追溯具体流程,调用失败无此字段。 在某些错误情况下可能没有此令牌字符串。 result 是 SASRResult 调用成功表示识别结果,调用失败时无此字段。请参考表5。 表5 SASRResult
HotWordRequest 参数名称 是否必选 参数类型 描述 name 是 String 热词表名,创建时不可重复。内容限制为字母,数字,下中划线和井号,长度不超过32字节。 language 是 String 热词表语言类型,目前支持汉语普通话“chinese_mandarin”。
HotWordRequest 参数名称 是否必选 参数类型 描述 name 是 String 热词表名,创建时不可重复。内容限制为字母,数字,下中划线和井号,长度不超过32字节。 language 是 String 热词表语言类型,目前支持汉语普通话“chinese_mandarin”。
FlashLasrResponse 参数 是否必选 参数类型 描述 trace_id 是 String 可用于在日志中追溯具体流程,调用失败无此字段。 在某些错误情况下可能没有此令牌字符串。 audio_duration 是 Integer 音频时长,单位毫秒 flash_result 是 Array of