已找到以下 168 条记录
AI智能搜索
产品选择
语音交互服务 SIS
没有找到结果,请重新输入
产品选择
语音交互服务 SIS
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 提交录音文件识别任务 - 语音交互服务 SIS

    账户创建企业项目后,在传参时,有以下三类场景。 携带正确ID,正常使用SIS服务,账单归到企业ID对应企业项目中。 携带错误ID,正常使用SIS服务,账单企业项目会被分类为“default”。 不携带ID,正常使用SIS服务,账单企业项目会被分类为“default”。 表4 请求Body参数

  • 语音交互服务使用简介 - 语音交互服务 SIS

    、普通话或者带有一定方言语音文件识别成可编辑文本,同时也支持通过调用语音合成接口将文本转换成逼真的语音等。适用场景有语音客服质检、会议记录、语音短消息、有声读物、电话回访等。 调用API接口需要具备一定编程开发能力,返回结果为JSON格式,用户需要通过编程来处理识别结果。

  • 一句话识别Websocket接口 - 语音交互服务 SIS

    一句话识别Websocket接口 前提条件 确保已按照配置Java环境配置完毕。 确保已存在待识别的音频文件。如果需要请在下载SDK压缩包中获取示例音频。 该功能为1.70及以上版本SDK新增功能,使用前请检查并更新SDK版本。 请参考SDK(websocket)获取最新版本SDK包。

  • SDK(websocket) - 语音交互服务 SIS

    下载SDK包 语音交互SDK软件包获取请参见表 下载SDK包。 示例音频参见示例音频。 当您使用过旧版本Java SDK时,需要注意旧版本SDK依赖jar包与新版本SDKjar包有无冲突。新版本SDK升级日志为log4j2,同时java-sdk-core升级到3.0.12版本。

  • 认证鉴权 - 语音交互服务 SIS

    Token有效期为24小时,需要使用同一个Token鉴权时,可以缓存起来,避免频繁调用。 Token在计算机系统中代表令牌(临时)意思,拥有Token就代表拥有某种权限。Token认证就是在调用API时候将Token加到请求消息头,从而通过身份认证,获得操作API权限。 代

  • 一句话识别Websocket接口 - 语音交互服务 SIS

    一句话识别Websocket接口 前提条件 确保已按照配置Python环境配置完毕,Python SDK仅支持Python3。 确保已存在待识别的音频文件。如果需要请在下载SDK压缩包中获取示例音频。 该功能为1.70及以上版本SDK新增功能,使用前请检查并更新SDK版本。 请参考SDK(websocket)获取最新版本SDK包。

  • 应用场景简介 - 语音交互服务 SIS

    SIS支持通过企业项目管理(EPS)对不同用户组和用户资源使用,进行分账。企业可以根据组织架构规划不同企业项目,并为每个企业项目设置拥有不同权限用户组和用户,多个企业项目之间相互独立,资源分开结算。 企业账号可申请开通企业项目。账号需要进行企业实名认证。如果企业账号注册成为华为云合作伙伴,将无法进入企业项目管理页面。

  • 语音合成(http版) - 语音交互服务 SIS

    true); 配置认证信息。 配置AK、SK、project_id信息。华为云通过AK识别用户身份,通过SK对请求数据进行签名验证,用于确保请求机密性、完整性和请求者身份正确性。 使用永久AK和SK BasicCredentials basicCredentials = new

  • 一句话识别(http版) - 语音交互服务 SIS

    和config两个参数,其中data为识别音频base64格式字符串。Config参数详见表1。 表1 Config 参数 是否必选 参数类型 描述 audioFormat 是 String 支持语音格式,请参考表 audio_format取值范围。 property 是 String 所使用模型特征串,通常是

  • 如何申请公测 - 语音交互服务 SIS

    如何申请公测 当前语音交互服务在中国区已全部商用,不需要申请,直接可以调用,调用会收费,计费方式详细请参考语音交互价格计算器。调用详细操作请参考使用实时语音识别 。 登录华为云,单击右上角“控制台”,进入“管理控制台”界面。 在左侧服务列表中选择“EI企业智能 > 语音交互服务”。

  • 如何调用WebSocket API - 语音交互服务 SIS

    其中,基于WebSocket协议进行实时语音识别时,需要客户端首先发送转写开始消息,然后持续发送语音数据至服务端,最后发送结束消息,在此期间客户端会持续收到服务端发送转写结果或事件,客户端根据所收到响应消息做对应处理。实时语音识别接口具体细节请参见接口说明章节。 图1 客户端与服务端交流流程

  • 实时语音识别工作流程 - 语音交互服务 SIS

    实时语音识别工作流程 实时语音识别分为开始识别、发送音频数据、结束识别,断开连接四个阶段。 开始阶段需要发送开始指令,包含采样率,音频格式,是否返回中间结果等配置信息。服务端会返回一个开始响应。 发送音频阶段客户端会分片发送音频数据,服务会返回识别结果或者其他事件,如音频超时,静音部分过长等。

  • 语音合成 - 语音交互服务 SIS

    体信息请参见《API参考》中语音合成章节。 saved 否 Boolean 是否选择合成音频数据保存到本地,默认不保存。 saved_path 否 String 选择保存到本地路径,需要具体到音频文件,如D:/test.wav。 响应参数 Python SDK响应结果为Jso

  • 构造请求 - 语音交互服务 SIS

    e对应,传递除请求消息头之外内容。若请求消息体中参数支持中文,则中文字符必须为UTF-8编码。 每个接口请求消息体内容不同,也并不是每个接口都需要有请求消息体(或者说消息体为空),GET、DELETE操作类型接口就不需要消息体,消息体具体内容需要根据具体接口而定。 对于一句

  • 录音文件识别 - 语音交互服务 SIS

    of objects 识别结果, 多句结果数组。 数据结构参见表5。 表5 Segment 参数名 是否必选 参数类型 说明 start_time 是 Integer 一句起始时间戳,单位ms。 end_time 是 Integer 一句结束时间戳,单位ms。 result 是

  • Token怎么获取 - 语音交互服务 SIS

    } } } 如下图所示,返回响应消息头中“x-subject-token”就是需要获取用户Token。获取Token之后,您就可以使用Token认证调用SIS服务API。 获取Token后,再调用SIS服务API接口时,您需要在请求消息头中添加“X-Auth-Tok

  • 身份认证与访问控制 - 语音交互服务 SIS

    Key)加密调用请求。经过认证请求总是需要包含一个签名值,该签名值以请求者访问密钥(AK/SK)作为加密因子,结合请求体携带特定信息计算而成。通过访问密钥(AK/SK)认证方式进行认证鉴权,即使用Access Key ID(AK)/Secret Access Key(SK)加密方法来验证某

  • 什么是语音交互服务 - 语音交互服务 SIS

    使用前必读 用户需要具备编程能力,熟悉Java、Python、IOS等编程语言。 用户通过调用API接口,将语音文件识别成可编辑文本,然后返回JSON格式识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 首次使用SIS 如果您是首次使用SIS用户,建议您学习并了解如下信息:

  • 什么是区域与可用区 - 语音交互服务 SIS

    器下。 资源价格 不同区域资源价格可能有差异,请参见华为云服务价格详情。 如何选择可用区 是否将资源放在同一可用区内,主要取决于您对容灾能力和网络时延要求。 如果您应用需要较高容灾能力,建议您将资源部署在同一区域不同可用区内。 如果您应用要求实例之间网络延时较低,则建议您将资源创建在同一可用区内。

  • 录音文件识别极速版 - 语音交互服务 SIS

    当前语音服务仅支持北京和上海区域,后续会陆续上线其他区域。 华北-北京四,推荐区域。 华东-上海一,推荐区域。 支持wav、mp3、m4a、acc、opus格式音频文件。 语音时长不超过120分钟,文件大小不超过100M。 支持从华为云对象存储服务(OBS)下载音频,需要用户提供OBS桶名和对象键值。 父主题: 约束与限制