已找到以下 119 条记录
AI智能搜索
产品选择
语音交互服务 SIS
没有找到结果,请重新输入
产品选择
语音交互服务 SIS
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 服务开通、关闭说明 - 语音交互服务 SIS

    服务开通、关闭说明 使用SIS服务,无需显性执行开通操作,注册华为账号并开通华为云后,账户未欠费,即可调用SIS服务,调用成功后即认为已开通调用接口。此时计费方式为按需计费,不使用不计费。若用户从未调用过SIS服务接口,账户欠费则会被拦截,无法调用。 您也可以在控制台购买套餐包,

  • 计费说明 - 语音交互服务 SIS

    或时长。 购买套餐包在生效期内,扣费方式是先扣除已购买套餐包内额度后,超出部分以按需计费方式进行结算。 购买套餐包到期后如果没有购买新套餐包,系统会自动转为按需计费。 变更配置 SIS默认使用按需计费。您也可以根据您实际情况购买资源包,购买后对应区域资源将自动转为

  • 概述 - 语音交互服务 SIS

    录音文件识别接口,用于转写不超过5小时音频。由于录音文件转写需要较长时间,因此转写是异步。 表4 语音合成接口说明 接口类型 说明 语音合成/实时语音合成 语音合成,依托先进语音技术,使用深度学习算法,将文本转换为自然流畅语音。用户通过实时访问和调用API获取语音合成结果,将用户输入文字合成为音

  • 错误码 - 语音交互服务 SIS

    invalid报错,请使用存放在OBS音频文件路径,并确保OBSregion要和请求服务region保持一致。 SIS.0535 录音文件识请求文件类型不支持。 确保设置audio_format格式值是合法。录音文件识别支持音频格式如表7所示。 确保待识别音频格式和接口参数中设置audio_format参数格式一致。

  • 使用实时语音合成 - 语音交互服务 SIS

    初始化RttsClient,其参数包括AuthInfo 表1 AuthInfo 参数名称 是否必选 参数类型 描述 ak 是 String 用户ak,可参考AK/SK认证。 sk 是 String 用户sk,可参考AK/SK认证。 projectId 是 String 项目ID,同region一一对应,参考获取项目ID。

  • 热词管理 - 语音交互服务 SIS

    表1 HotWordClient初始化参数 参数名称 是否必选 参数类型 描述 ak 是 String 用户ak,可参考AK/SK认证。 sk 是 String 用户sk,可参考AK/SK认证。 region 是 String 区域,如:cn-north-4。具体请参考终端节点。

  • 录音文件识别 - 语音交互服务 SIS

    of objects 识别结果, 多句结果数组。 数据结构参见表5。 表5 Segment 参数名 是否必选 参数类型 说明 start_time 是 Integer 一句起始时间戳,单位ms。 end_time 是 Integer 一句结束时间戳,单位ms。 result 是

  • SDK简介 - 语音交互服务 SIS

    SDK(Windows)、CPP SDK(Linux)。后序章节均指代该SDK。 Java接口API对应关系 Java接口API对应关系请参见表 Java接口API对应关系表。 表1 Java接口API对应关系表 Class Method API 功能名称 RasrClient void

  • 如何调用WebSocket API - 语音交互服务 SIS

    后持续发送语音数据至服务端,最后发送结束消息,在此期间客户端会持续收到服务端发送转写结果或事件,客户端根据所收到响应消息做对应处理。实时语音识别接口具体细节请参见接口说明章节。 图1 客户端服务端交流流程

  • 为什么会出现识别结果非常差情况 - 语音交互服务 SIS

    为什么会出现识别结果非常差情况 问题现象 调用语音识别接口,识别结果同真实结果差别很大,或者服务端报音频格式错误。 解决方案 检查音频采样率是否符合。 对于裸音频,可采用toolsoft Audio player等工具进行试听,通过设置不同采样率,播放正常即为音频正常采样率。

  • 录音文件识别 - 语音交互服务 SIS

    格式,详见API参考文档中“audio_format取值范围”。 语音时长不超过5小时,文件大小不超过300M,用户识别任务在6小时内完成并返回识别结果,识别结果保存72小时(从转写完成时间算起)。 支持中文普通话、四川话识别。 父主题: 约束限制

  • 实时语音识别 - 语音交互服务 SIS

    华北-北京四,推荐区域,支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。 华东-上海一,推荐区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。 音频采样率8KHz或者16KHz,采样位数8bit或者16bit。 支持中文普通话、方言和英语语音识别,其中方言包括:四川话、粤语和上海话。

  • 返回结果 - 语音交互服务 SIS

    返回结果 状态码 请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx数字代码,状态码表示了请求响应状态,完整状态码列表请参见状态码。 对于SIS服务接口,如果调用后返回状态码为“200”,则表示请求成功。 响应消息头 对应请求消息头,

  • 如何查看当前接口是否免费调用 - 语音交互服务 SIS

    套餐包购买时长为1年,可通过叠加套餐包累加API调用次数或时长。 购买套餐包在生效期内,扣费方式是先扣除已购买套餐包内额度后,超出部分以按需计费方式进行结算。 购买套餐包到期后如果没有购买新套餐包,系统会自动转为按需计费。 父主题: 产品咨询类

  • 应用场景 - 语音交互服务 SIS

    体验。 智能教育 集成语音合成教育系统可以实现中文标准朗读及带读,应用于课堂和学生自学,提升教学效率。 直播实时字幕 将视频直播或现场直播中音频实时转为字幕,为观众提供更高效观会体验,方便对直播内容进行监控。 会议实时记录 将视频或电话会议中音频实时转为文字,可实时校核、修改及检索转写会议内容,提高会议效率。

  • 构造请求 - 语音交互服务 SIS

    resource-path 资源路径,即API访问路径。从具体APIURI模块获取,例如“一句话识别”APIresource-path为“/v1/{project_id}/asr/short-audio”。其中“project_id”需要替换成用户项目ID,可参考获取项目ID。 query-string

  • 配置热词表(可选) - 语音交互服务 SIS

    用于提升热词召回率,主要应用于以下场景。 所配置关键词常见词发音一样,导致热词不能百分百生效。如雇工 vs 故宫。由于故宫更加常见,所以可能存在即使配置了雇工这个热词,也无法召回情况。 所配置关键词含有生僻字,如葳蕤,霜蟾。这些生僻字出现概率较低,所以在热词搜索过程中,可能不生效。 所配置关键词较常见,与其他高频词容易混淆(误召回),如述职

  • 开始识别 - 语音交互服务 SIS

    如果设置为0,表示不检测“长时间静音”情况。 取值范围:[0, 60000]整数,单位为ms,默认为10000ms,即10s。 vad_tail 否 Integer 音频结尾中静音时间,正常情况下不应设成很小值。 如果检测语音结尾静音时长大于等于此值时,在实时语音识别单句模式下将返回VO

  • websocket接口 - 语音交互服务 SIS

    要实时反馈情况下100ms,不需要实时反馈情况下500ms。 结束识别 功能介绍 对于识别中对话,需要在Websocket上发送“结束识别”请求来取消或结束识别。 "结束识别"请求使用文本类型数据帧(text message)发送,命令和参数以json字符串形式提供。