已找到以下 132 条记录
产品选择
语音交互服务 SIS
没有找到结果,请重新输入
产品选择
语音交互服务 SIS
产品选择
没有找到结果,请重新输入
  • 一句话识别Websocket接口 - 语音交互服务 SIS

    一句话识别Websocket接口 前提条件 确保已按照配置Python环境配置完毕,Python SDK仅支持Python3。 确保已存在待识别的音频文件。如果需要请在下载SDK压缩包中获取示例音频。 该功能为1.70及以上版本SDK新增功能,使用前请检查并更新SDK版本。 初始化Client

  • 录音文件识别多久可以返回结果 - 语音交互服务 SIS

    录音文件识别多久可以返回结果 音频转写时长受音频时长和排队任务数量影响,音频时长和理论返回时间可参见表 音频转写时长参考表。如果转写耗时比理论时延长,大概率表示当前时间段出现转写高峰,请耐心等待,我们承诺最大转写时长不超过6小时。 表1 音频转写时长参考表 音频时长 参考返回时间

  • 一句话识别Websocket接口 - 语音交互服务 SIS

    一句话识别Websocket接口 前提条件 确保已按照配置Java环境配置完毕。 确保已存在待识别的音频文件。如果需要请在下载SDK压缩包中获取示例音频。 该功能为1.70及以上版本SDK新增功能,使用前请检查并更新SDK版本。 初始化Client 初始化SasrWebsock

  • 语音交互服务区域如何选择 - 语音交互服务 SIS

    语音交互服务区域如何选择 不同区域资源之间内网不互通。为保证网络连通性,降低网络时延、提高访问速度,请选择靠近您客户区域,当前语音服务支持北京和上海区域,后续会陆续上线其他区域,当前支持区域请参见地区与终端节点。 华北-北京四,为推荐区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

  • 创建热词表 - 语音交互服务 SIS

    创建热词表 在一句话识别、录音文件识别、实时语音识别服务中,如果在您业务领域有一些特有的词,默认识别效果差时候可以考虑使用热词管理功能,将这些词添加到词表,改善识别效果。 热词可以是姓名、公司名、某个领域专有名词,如人名"王晓茗”(通常会识别为"王小明”)、运输域“高栏”等。热

  • 构造请求 - 语音交互服务 SIS

    resource-path 资源路径,即API访问路径。从具体APIURI模块获取,例如“一句话识别”APIresource-path为“/v1/{project_id}/asr/short-audio”。其中“project_id”需要替换成用户项目ID,可参考获取项目ID。 query-string

  • 配置热词表(可选) - 语音交互服务 SIS

    调用一句话识别、录音文件识别、实时语音识别API时,如果在您业务领域有一些特有的词,默认识别效果差时候可以考虑使用热词管理功能,将这些词添加到词表,改善识别效果。 创建热词表(1.0版本) 创建热词表有两种方式:控制台创建、调用API创建。本章节主要介绍通过控制台创建方法。 登录SIS服务控制台。

  • 语音交互服务使用简介 - 语音交互服务 SIS

    通过实时访问和调用API获取语音交互结果。华为云SIS服务支持调用一句话识别、录音文件识别、实时语言识别、语音合成接口等。用户通过调用语音识别类接口,将口述音频、普通话或者带有一定方言语音文件识别成可编辑文本,同时也支持通过调用语音合成接口将文本转换成逼真的语音等。适用场景有

  • 计费说明 - 语音交互服务 SIS

    计费说明 计费项 一句话识别、语音合成按调用次数计费;实时语音识别、录音文件识别按音频时长计费;录音文件识别极速版按照“音频时长×需要识别的音频声道数“计费,时长计算精确到秒。 按音频时长计费,累加每次调用音频时长。 按调用次数计费,返回失败调用不计入次数。 调用热词接口,不单独计费。

  • 概述 - 语音交互服务 SIS

    一句话识别接口,用于短语音同步识别。一次性上传整个音频,响应中即返回识别结果。 表3 录音文件识别接口说明 接口类型 说明 录音文件识别 录音文件识别接口,用于转写不超过5小时音频。由于录音文件转写需要较长时间,因此转写是异步。 表4 语音合成接口说明 接口类型 说明 语音合成/实时语音合成

  • 终端节点 - 语音交互服务 SIS

    华东-上海一,推荐区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口 。 一句话识别,录音文件识别支持终端节点: 表1 一句话识别、录音文件识别 区域名称 区域 终端节点(Endpoint) 协议类型 华北-北京四 cn-north-4 sis-ext

  • 配置OBS访问权限 - 语音交互服务 SIS

    、高可靠、低成本数据存储能力,可供用户存储任意类型和大小数据。 EI企业智能服务对于图片、语音等多媒体文件支持直接使用华为云OBS服务数据处理方式,以减少服务使用成本,降低服务响应时长,提升服务使用体验。语音交互服务优先推荐使用同一region下OBS音频链接作为传入音频的URL。

  • 支持哪些语言 - 语音交互服务 SIS

    支持哪些语言 录音文件识别、语音合成支持中文普通话。 一句话识别和实时语音识别支持中文普通话,带方言口音普通话和方言(四川话、粤语和上海话)。 父主题: 产品咨询类

  • 功能体验与试用 - 语音交互服务 SIS

    Interaction Service,SIS)支持语音识别、语音合成功能。适用语音客服质检、会议记录、语音短消息、有声读物、电话回访等场景。 在使用服务前,请先使用SIS体验中心体验服务功能。该方式无需编程,只需在网页端上传文字或音频,即可体验合成效果。 使用SIS体验中心前,请先注册华为账号并开通华为云。

  • SIS.0032报错 - 语音交互服务 SIS

    为何调用一句话识别的api接口,返回错误码"SIS.0032",错误信息为:"'audio_format' is invalid"? 解决方案 确保设置audio_format格式值是合法,待识别的音频格式和audio_format参数格式要保证一致。 一句话识别支持音频格式详见表1。

  • 本地调用 - 语音交互服务 SIS

    本地调用 本章节以语音合成为例,介绍如何使用SIS Python SDK在本地进行开发。 该SDK可以将用户输入文字合成为音频。通过音色选择,自定义音量、语速,实现个性化音频生成。 前提条件 注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费、冻结、被注销等异常状态。

  • 与其他云服务关系 - 语音交互服务 SIS

    SIS服务接口支持从对象存储服务(Object Storage Service,OBS)采用临时授权和匿名公开授权方式获取数据并进行处理。录音文件识别支持从OBS采用授权方式获取数据并进行处理。OBS更多信息请参见《对象存储服务产品介绍》。

  • SIS.0535报错 - 语音交互服务 SIS

    使用SDK调用录音文件识别时一直返回"SIS.0535",错误信息显示为:"Audio format is invalid!" 解决方案 确保设置audio_format格式值是合法,即设置格式是表1中格式。 确保待识别音频格式和接口参数中设置audio_format参数格式一致。

  • 在线调试 - 语音交互服务 SIS

    登录后,“X-Auth-Token”和“project_id”参数会自动填充,无需填写。 填写待合成文字。 在text中输入待合成文本,其中config参数为合成音频音色、语速、格式等设置项,可使用默认值。 单击“调试”按钮,获取识别结果。 父主题: 调用API或SDK

  • 什么是语音交互服务 - 语音交互服务 SIS

    tion Programming Interface,应用程序编程接口)获取语音交互结果。例如用户通过语音识别功能,将口述音频、普通话或者带有一定方言语音文件识别成可编辑文本,同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。