已找到以下 136 条记录
AI智能搜索
产品选择
语音交互服务 SIS
没有找到结果,请重新输入
产品选择
语音交互服务 SIS
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 如何查看当前接口是否免费调用 - 语音交互服务 SIS

    如何查看当前接口是否免费调用 计费项 一句话识别、语音合成按调用次数计费;实时语音识别、录音文件识别按音频时长计费;录音文件识别极速版按照“音频时长×需要识别的音频声道数“计费,时长计算精确到秒。 按音频时长计费,累加每次调用音频时长。 按调用次数计费,返回失败调用不计入次数。

  • 终端节点 - 语音交互服务 SIS

    终端节点即调用API请求地址,不同服务不同区域终端节点不同。 目前语音交互服务一句话识别、录音文件识别支持以下地区终端节点: 当前服务仅支持北京上海区域,后续会陆续上线其他区域。 华北-北京四,推荐区域,支持一句话识别、录音文件识别、实时语音识别、语音合成热词等接口。 华

  • 应用场景 - 语音交互服务 SIS

    语音客服质检 识别客服、客户语音,转换为文本。进一步通过文本检索,检查有没有违规、敏感词、电话号码等信息。 会议记录 对会议记录音频文件,进行快速识别,转化成文字,方便进行会议记录。 语音短消息 通过语音发送或者接收短消息时,将音频短消息转文字,提升阅读效率交互体验。 游戏娱乐

  • 如何调用WebSocket API - 语音交互服务 SIS

    基于WebSocket协议进行实时语音识别。 关闭WebSocket连接。 其中,基于WebSocket协议进行实时语音识别时,需要客户端首先发送转写开始消息,然后持续发送语音数据至服务端,最后发送结束消息,在此期间客户端会持续收到服务端发送转写结果或事件,客户端根据所收到响应消息做对应处理。

  • 录音文件识别多久可以返回结果 - 语音交互服务 SIS

    录音文件识别多久可以返回结果 音频转写时长受音频时长排队任务数量影响,音频时长理论返回时间可参见表 音频转写时长参考表。如果转写耗时比理论时延长,大概率表示当前时间段出现转写高峰,请耐心等待,我们承诺最大转写时长不超过6小时。 表1 音频转写时长参考表 音频时长 参考返回时间

  • 为什么会出现识别结果非常差情况 - 语音交互服务 SIS

    为什么会出现识别结果非常差情况 问题现象 调用语音识别接口,识别结果同真实结果差别很大,或者服务端报音频格式错误。 解决方案 检查音频采样率是否符合。 对于裸音频,可采用toolsoft Audio player等工具进行试听,通过设置不同采样率,播放正常即为音频正常采样率。

  • 为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

    为什么录音文件识别出现重复转写结果 问题现象 调用录音文件识别接口,识别的结果出现两条完全一致结果。 解决方案 由于声道设置原因,单声道音频按照双声道处理了。 在请求中将参数“channel”值修改成“MONO”或者直接去掉请求参数中“channel”项。 父主题: API使用类

  • 构造请求 - 语音交互服务 SIS

    resource-path 资源路径,即API访问路径。从具体APIURI模块获取,例如“一句话识别”APIresource-path为“/v1/{project_id}/asr/short-audio”。其中“project_id”需要替换成用户项目ID,可参考获取项目ID。 query-string

  • 创建热词表 - 语音交互服务 SIS

    创建热词表 在一句话识别、录音文件识别、实时语音识别服务中,如果在您业务领域有一些特有的词,默认识别效果差时候可以考虑使用热词管理功能,将这些词添加到词表,改善识别效果。 热词可以是姓名、公司名、某个领域专有名词,如人名"王晓茗”(通常会识别为"王小明”)、运输域“高栏”等。热

  • SIS.0032报错 - 语音交互服务 SIS

    为何调用一句话识别的api接口,返回错误码"SIS.0032",错误信息为:"'audio_format' is invalid"? 解决方案 确保设置audio_format格式值是合法,待识别的音频格式audio_format参数格式要保证一致。 一句话识别支持音频格式详见表1。

  • 配置热词表(可选) - 语音交互服务 SIS

    调用一句话识别、录音文件识别、实时语音识别API时,如果在您业务领域有一些特有的词,默认识别效果差时候可以考虑使用热词管理功能,将这些词添加到词表,改善识别效果。 创建热词表(1.0版本) 创建热词表有两种方式:控制台创建、调用API创建。本章节主要介绍通过控制台创建方法。 登录SIS服务控制台。

  • 计费说明 - 语音交互服务 SIS

    计费说明 计费项 一句话识别、语音合成按调用次数计费;实时语音识别、录音文件识别按音频时长计费;录音文件识别极速版按照“音频时长×需要识别的音频声道数“计费,时长计算精确到秒。 按音频时长计费,累加每次调用音频时长。 按调用次数计费,返回失败调用不计入次数。 调用热词接口,不单独计费。

  • SIS.0535报错 - 语音交互服务 SIS

    使用SDK调用录音文件识别时一直返回"SIS.0535",错误信息显示为:"Audio format is invalid!" 解决方案 确保设置audio_format格式值是合法,即设置格式是表1中格式。 确保待识别音频格式接口参数中设置audio_format参数格式一致。

  • 概述 - 语音交互服务 SIS

    表2 一句话识别接口说明 接口类型 说明 一句话识别 一句话识别接口,用于短语音同步识别。一次性上传整个音频,响应中即返回识别结果。 表3 录音文件识别接口说明 接口类型 说明 录音文件识别 录音文件识别接口,用于转写不超过5小时音频。由于录音文件转写需要较长时间,因此转写是异步的。

  • 什么是语音交互服务 - 语音交互服务 SIS

    Service,简称SIS)是一种人机交互方式,用户通过实时访问调用API(Application Programming Interface,应用程序编程接口)获取语音交互结果。例如用户通过语音识别功能,将口述音频、普通话或者带有一定方言语音文件识别成可编辑文本,同时也支持通过语音合成功能将文本转

  • SDK简介 - 语音交互服务 SIS

    Interaction Service,简称SIS)是一种人机交互方式,用户通过实时访问调用API获取语音交互结果。支持用户通过语音识别功能,将口述音频、普通话或者带有一定方言语音文件识别成可编辑文本,同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音

  • 配置OBS访问权限 - 语音交互服务 SIS

    、高可靠、低成本数据存储能力,可供用户存储任意类型大小数据。 EI企业智能服务对于图片、语音等多媒体文件支持直接使用华为云OBS服务数据处理方式,以减少服务使用成本,降低服务响应时长,提升服务使用体验。语音交互服务优先推荐使用同一region下OBS音频链接作为传入音频的URL。

  • 与其他云服务关系 - 语音交互服务 SIS

    与其他云服务关系 SIS服务与周边其他服务关系如图1所示。 图1 SIS与其他服务关系图 统一身份认证服务 统一身份认证(Identity and Access Management,简称IAM)服务,IAM为语音交互服务提供了用户认证鉴权功能。 对象存储服务 SIS服务接口支持从对象存储服务(Object

  • 返回结果 - 语音交互服务 SIS

    返回结果 状态码 请求发送以后,您会收到响应,包含状态码、响应消息头消息体。 状态码是一组从1xx到5xx数字代码,状态码表示了请求响应状态,完整状态码列表请参见状态码。 对于SIS服务接口,如果调用后返回状态码为“200”,则表示请求成功。 响应消息头 对应请求消息头,

  • API使用类 - 语音交互服务 SIS

    API使用类 如何查看接口调用量 为什么WebSocket一直连接不成功 为什么会出现识别结果非常差情况 如何使用Websocket调用实时语音识别 有哪些途径可以使用语音交互API 返回状态正常,但识别结果为空 Token消息体中user name,domain nameproject