已找到以下 37 条记录
AI智能搜索
产品选择
语音交互服务 SIS
没有找到结果,请重新输入
产品选择
语音交互服务 SIS
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • API使用类 - 语音交互服务 SIS

    为什么会出现识别结果非常差的情况 如何使用Websocket调用实时语音识别 哪些途径可以使用语音交互的API 返回状态正常,但识别结果为空 Token消息体中user name,domain nameproject name分别指的是什么 如何调整并发 为什么录音文件识别出现重复转写结果

  • 调用语音交互的API显示auth failed - 语音交互服务 SIS

    调用语音交互的API显示auth failed 问题现象 校验失败服务端通常是使用不正确的Token进行访问,可能产生的原因多种。 解决方案 检查用户账号是否正常。 当用户账号存在未实名认证、未充值或者属于冻结状态。您可登录账号,在用户检查是否实名认证,是否有余额(以上信息在用户Console均可以查到)。

  • 基本概念 - 语音交互服务 SIS

    由账号在IAM中创建的用户,是云服务的使用人员,具有身份凭证(密码访问密钥)。 在我的凭证下,您可以查看账号ID用户ID。通常在调用API的鉴权过程中,您需要用到账号、用户密码等信息。 区域(Region) 从地理位置网络时延维度划分,同一个Region内共享弹性计算、块存储、

  • 配置热词表(可选) - 语音交互服务 SIS

    配置热词表(可选) 调用一句话识别、录音文件识别、实时语音识别API时,如果在您的业务领域一些特有的词,默认识别效果差的时候可以考虑使用热词管理功能,将这些词添加到词表,改善识别效果。 创建热词表(1.0版本) 创建热词表两种方式:控制台创建、调用API创建。本章节主要介绍通过控制台创建的方法。

  • 身份认证与访问控制 - 语音交互服务 SIS

    身份认证与访问控制 身份认证 用户访问SIS的方式多种,包括SIS控制台、API、SDK,无论访问方式封装成何种形式,其本质都是通过SIS提供的API接口进行请求。 SIS的接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 Token认证:通过Token认证调用请求。 AK/SK认证:通过AK(Access

  • 配置OBS访问权限 - 语音交互服务 SIS

    OBS全称Object Storage Service(对象存储服务),提供海量、安全、高可靠、低成本的数据存储能力,可供用户存储任意类型大小的数据。 EI企业智能服务对于图片、语音等多媒体文件支持直接使用华为云OBS服务的数据处理方式,以减少服务使用成本,降低服务的响应时长,

  • 实时语音识别连续模式 - 语音交互服务 SIS

    返回识别结果。如果送入的一段语音较长,甚至可能在一次返回中包括了多段的识别结果。 由于引入了静音检测,连续识别模式通常会比流式识别能具有更高的效率,因为对于静音段将不会进行特征提取和解码操作,因而能更有效地利用CPU。而流式识别通常客户端的端点检测功能相结合,只将检测到的有效语音段上传到服务器进行识别。

  • 计费说明 - 语音交互服务 SIS

    无论是否套餐包剩余。若欠费前已调用对应接口,则默认开通该接口,欠费后可继续使用至账户被华为云账户中心冻结为止。冻结由账户中心控制,一般情况下套餐包未使用完不会被冻结。 不可重置且不是续期购买套餐包方式的API接口,例如“一句话识别1万次套餐包”,在欠费后如果套餐包剩余,可继续使用,但不可购买,也不可续期。

  • 构造请求 - 语音交互服务 SIS

    myhuaweicloud.com/v1/{project_id}/asr/short-audio 请求消息头 附加请求头字段,如指定的URIHTTP方法所要求的字段。例如定义消息体类型的请求头“Content-Type”,请求鉴权信息等。 如下公共消息头需要添加到请求中。 Con

  • 创建热词表 - 语音交互服务 SIS

    创建热词表 在一句话识别、录音文件识别、实时语音识别服务中,如果在您的业务领域一些特有的词,默认识别效果差的时候可以考虑使用热词管理功能,将这些词添加到词表,改善识别效果。 热词可以是姓名、公司名、某个领域的专有名词,如人名"王晓茗”(通常会识别为"王小明”)、运输域的“高栏”

  • Websocket握手请求 - 语音交互服务 SIS

    EPS)对不同用户组用户的资源使用,进行分账。 获取方法:进入“企业项目管理”页面,单击企业项目名称,在企业项目详情页获取Enterprise-Project-Id(企业项目ID)。 企业项目创建步骤请参见用户指南。 说明: 账户创建企业项目后,在传参时,以下三类场景。 携带

  • 实时语音识别单句模式 - 语音交互服务 SIS

    、控制口令等场景。 实时语音识别引擎的单句识别模式,连续识别模式类似,也会进行语音的端点检测,如果检测到静音,将直接丢弃,检测到语音才会馈入核心进行实际的解码工作,如果检测到一段语音的结束点,就会将当前这一段的识别结果返回。连续识别不同的是,在单句模式下,返回第一段的识别结果

  • SSML标记语言介绍 - 语音交互服务 SIS

    的语音合成标记语言。使用 SSML 可以更加准确、具体的定义合成音频的效果,包括控制断句分词方式、发音、速度、停顿、声调和音量等特征。相比文本输入进行合成,更好的操作灵活性。 华为云语音合成服务的SSML实现,基于W3C的语音合成标记语言版本1.1,但并不支持W3C包含的所有的标记类型。目前仅华小飞,华小美,华小龙,华小蕊合成支持

  • 流式一句话 - 语音交互服务 SIS

    EPS)对不同用户组用户的资源使用,进行分账。 获取方法:进入“企业项目管理”页面,单击企业项目名称,在企业项目详情页获取Enterprise-Project-Id(企业项目ID)。 企业项目创建步骤请参见用户指南。 说明: 账户创建企业项目后,在传参时,以下三类场景。 携带

  • 错误码 - 语音交互服务 SIS

    请检查音频文件大小是否满足要求。 SIS.0506 找不到代理错误。 请检查网络是否设置代理。 请在控制台检查OBS是否已授权。 SIS.0507 录音文件识别极速版输入参数无效。 请检查obs_bucket_nameobs_object_key参数是否为空。 SIS.0511 录音文件识别极速版待识别音频无效。

  • 语音合成 - 语音交互服务 SIS

    语音合成 功能介绍 语音合成,是一种将文本转换成逼真语音的服务。用户通过实时访问调用API获取语音合成结果,将用户输入的文字合成为音频。通过音色选择、自定义音量、语速,为企业个人提供个性化的发音服务。该接口的使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。

  • websocket接口 - 语音交互服务 SIS

    EPS)对不同用户组用户的资源使用,进行分账。 获取方法:进入“企业项目管理”页面,单击企业项目名称,在企业项目详情页获取Enterprise-Project-Id(企业项目ID)。 企业项目创建步骤请参见用户指南。 说明: 账户创建企业项目后,在传参时,以下三类场景。 携带