已找到以下 216 条记录
产品选择
语音交互服务 SIS
没有找到结果,请重新输入
产品选择
语音交互服务 SIS
产品选择
没有找到结果,请重新输入
  • 一句话识别Websocket接口 - 语音交互服务 SIS

    trace_id 是 String 服务内部令牌,可用于在日志中追溯具体流程。 segments 是 Array of objects 多句结果。详见表5。 表5 Segment 参数名称 是否必选 参数类型 描述 start_time 是 Integer 一句起始时间戳,单位为ms。 end_time

  • 在线调试 - 语音交互服务 SIS

    Explorer在线调试工具提供API检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码构建、调试、运行。 本章节以语音合成为例,介绍如何使用API Explorer调试API。 前提条件 注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费、冻结、注销等异常状态。

  • 公共请求参数 - 语音交互服务 SIS

    Sec-WebSocket-Key 发送WebSocket握手请求时,包含该头域。 采用Base64编码随机16字节长字符序列。用来发送给服务器使用,服务器会使用此字段组装成另一个key值放在握手返回信息里发送客户端。 x3JJHMbDL1EzLkh9GBhXDw== Sec-WebSocket-Version

  • SIS.0535报错 - 语音交互服务 SIS

    0535",错误信息显示为:"Audio format is invalid!" 解决方案 确保设置audio_format格式值是合法,即设置格式是表1中格式。 确保待识别音频格式和接口参数中设置audio_format参数格式一致。 表1 录音文件识别支持音频格式 audioformat取值

  • 实时语音识别 - 语音交互服务 SIS

    trace_id 是 String 服务内部令牌,可用于在日志中追溯具体流程。 segments 是 Array of objects 多句结果。详见表5。 表5 Segment 参数名称 是否必选 参数类型 描述 start_time 是 Integer 一句起始时间戳,单位为ms。 end_time

  • APIG.0301报错 - 语音交互服务 SIS

    0301",是因为token解密失败。 解决方案:(1)请检查token是否过期;(2)获取token方法,请求体信息是否填写正确,token是否正确完整;(3)获取token环境调用环境是否一致是否跨区;(4)检查账号权限,是否欠费,冻结等。 "error_msg":"Incorrect IAM authentication

  • 本地调用 - 语音交互服务 SIS

    本章节以语音合成为例,介绍如何使用SIS Python SDK在本地进行开发。 该SDK可以将用户输入文字合成为音频。通过音色选择,自定义音量、语速,实现个性化音频生成。 前提条件 注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费、冻结、注销等异常状态。 操作步骤 获取SIS Python SDK。 获取并下载SIS

  • 语音合成 - 语音交互服务 SIS

    语音合成,是一种将文本转换成逼真语音服务。用户通过实时访问和调用API获取语音合成结果,将用户输入文字合成为音频。通过音色选择、自定义音量、语速,为企业和个人提供个性化发音服务。该接口使用限制请参见约束限制,详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了语音合成在线使用页面,用户无需编程即可使用服务功能。

  • 错误码 - 语音交互服务 SIS

    invalid报错,请使用存放在OBS音频文件路径,并确保OBSregion要和请求服务region保持一致。 SIS.0535 录音文件识请求文件类型不支持。 确保设置audio_format格式值是合法。录音文件识别支持音频格式如表7所示。 确保待识别音频格式和接口参数中设置audio_format参数格式一致。

  • 语音合成 - 语音交互服务 SIS

    TtsCustomizationClient初始化参数 参数名称 是否必选 参数类型 描述 ak 是 String 用户ak,可参考AK/SK认证。 sk 是 String 用户sk,可参考AK/SK认证。 region 是 String 区域,如:cn-north-4。具体请参考终端节点。

  • 录音文件识别极速版接口 - 语音交互服务 SIS

    账户创建企业项目后,在传参时,有以下三类场景。 携带正确ID,正常使用SIS服务,账单归到企业ID对应企业项目中。 携带错误ID,正常使用SIS服务,账单企业项目会被分类为“default”。 不携带ID,正常使用SIS服务,账单企业项目会被分类为“default”。 表3 Query参数

  • 实时语音识别工作流程 - 语音交互服务 SIS

    别,断开连接四个阶段。 开始阶段需要发送开始指令,包含采样率,音频格式,是否返回中间结果等配置信息。服务端会返回一个开始响应。 发送音频阶段客户端会分片发送音频数据,服务会返回识别结果或者其他事件,如音频超时,静音部分过长等。 音频发送结束后,客户端会发送结束请求,服务端会返回end响应。

  • calc ak sk signature fail:signature expired报错 - 语音交互服务 SIS

    fail:signature expired报错。表示是AK、SK凭证过期。 请先检测您使用是临时AK、SK,还是永久性AK、SK。临时安全凭证通过接口临时访问密钥AK/SK获取;永久安全凭证通过我的凭证界面控制台获取。 如果使用是永久性AK、SK出现此报错。请检查您服务器时间和网络时间是否一致,时间同步后,可解决该报错。

  • SDK(websocket) - 语音交互服务 SIS

    示例音频参见示例音频。 当您使用过旧版本Java SDK时,需要注意旧版本SDK依赖jar包新版本SDKjar包有无冲突。新版本SDK升级日志为log4j2,同时java-sdk-core升级到3.0.12版本。 优先推荐使用新版SDK语音交互服务SDK,该SDK基于统一规范开发,支持Java/Python/C++/

  • http接口 - 语音交互服务 SIS

    账户创建企业项目后,在传参时,有以下三类场景。 携带正确ID,正常使用SIS服务,账单归到企业ID对应企业项目中。 携带错误ID,正常使用SIS服务,账单企业项目会被分类为“default”。 不携带ID,正常使用SIS服务,账单企业项目会被分类为“default”。 表3 请求Body参数

  • 概述 - 语音交互服务 SIS

    录音文件识别接口,用于转写不超过5小时音频。由于录音文件转写需要较长时间,因此转写是异步。 表4 语音合成接口说明 接口类型 说明 语音合成/实时语音合成 语音合成,依托先进语音技术,使用深度学习算法,将文本转换为自然流畅语音。用户通过实时访问和调用API获取语音合成结果,将用户输入文字合成为音

  • 语音合成(webSocket版) - 语音交互服务 SIS

    其中RttsResponseListener使用户自定义,建立webSocket之后,接受服务端返回消息Listener。 表4 RttsResponseListener 函数名称 作用 void onTranscriptionConnect(); webSocket建立连接后后调。 void onTranscriptionClose();

  • 调用Java SDK实现一句话识别 - 语音交互服务 SIS

    调用Java SDK实现一句话识别 语音交互服务软件开发工具包(SIS SDK)是对语音交互服务提供REST API进行封装,用户直接调用语音交互SDK提供接口函数即可实现使用语音交互业务能力目的,以简化用户开发工作。SIS SDK目前支持Java和Python。 本章节提供了通过Java

  • 认证鉴权 - 语音交互服务 SIS

    SK(Secret Access Key):访问密钥ID结合使用密钥,对请求进行加密签名,可标识发送方,并防止请求修改。 使用AK/SK认证时,您可以基于签名算法使用AK/SK对请求进行签名,也可以使用专门签名SDK对请求进行签名。详细签名方法和SDK使用方法请参见API签名指南。

  • 热词管理 - 语音交互服务 SIS

    表1 HotWordClient初始化参数 参数名称 是否必选 参数类型 描述 ak 是 String 用户ak,可参考AK/SK认证。 sk 是 String 用户sk,可参考AK/SK认证。 region 是 String 区域,如:cn-north-4。具体请参考终端节点。