已找到以下 15 条记录
产品选择
语音交互服务 SIS
没有找到结果,请重新输入
产品选择
语音交互服务 SIS
产品选择
没有找到结果,请重新输入
  • 功能介绍 - 语音交互服务 SIS

    功能介绍 实时语音识别 实时语音识别服务,用户通过实时访问调用API获取实时语音识别结果,支持的语言包含中文普通话、方言和英语,方言当前支持四川话、粤语上海话。 文本时间戳 为音频转换结果生成特定的时间戳,从而通过搜索文本即可快速找到对应的原始音频。 智能断句 通过提取上下文

  • 概述 - 语音交互服务 SIS

    语音合成/实时语音合成 语音合成,依托先进的语音技术,使用深度学习算法,将文本转换为自然流畅的语音。用户通过实时访问调用API获取语音合成结果,将用户输入的文字合成为音频。通过音色选择、自定义音量、语速、音高等,可自定义音频格式,为企业个人提供个性化的发音服务。 父主题: 使用前必读

  • 录音文件识别极速 - 语音交互服务 SIS

    录音文件识别极速 支持“华北-北京四”、“华东-上海一”区域。 当前语音服务仅支持北京上海区域,后续会陆续上线其他区域。 华北-北京四,推荐的区域。 华东-上海一,推荐的区域。 支持wav、mp3、m4a、acc、opus格式音频文件。 语音时长不超过120分钟,文件大小不超过100M。

  • 录音文件极速 - 语音交互服务 SIS

    录音文件极速 前提条件 确保已按照配置Java环境配置完毕。 确保已存在待识别的音频文件并上传OBS,示例音频可参考下载SDK压缩包文件,同时确保服务已授权访问OBS,可参考配置OBS服务。 初始化Client 初始化FlashLasrClient,其参数包括AuthInfoSisConfig。

  • 错误码 - 语音交互服务 SIS

    0511 录音文件识别极速待识别音频无效。 请检查音频时长是否满足要求。 SIS.0512 录音文件识别极速输入参数无效。 请检查obs_bucket_nameobs_object_key对应的桶名和文件名是否存在。 SIS.0513 录音文件识别极速输入参数无效。 请检查o

  • SDK(websocket) - 语音交互服务 SIS

    SDK时,需要注意旧版本的SDK依赖的jar包与新版本SDK的jar包有无冲突。新版本SDK升级日志为log4j2,同时java-sdk-core升级到3.0.12本。 优先推荐使用新版SDK语音交互服务SDK,该SDK基于统一规范开发,支持Java/Python/C++/.NET/Go/NodeJs/

  • 录音文件识别极速接口 - 语音交互服务 SIS

    es”“no”,默认为“no”。 digit_norm 否 String 表示是否将语音中的数字识别为阿拉伯数字,取值为“yes” “no”,默认为“yes”。 need_word_info 否 String 表示是否在识别结果中输出分词结果信息,取值为“yes”“no”,默认为“no”。

  • 语音合成(webSocket) - 语音交互服务 SIS

    语音合成(webSocket) 前提条件 确保已经按照配置好Android开发环境。 初始化Client 初始化RttsClient,其中参数包含AuthInfoSisHttpConfigRttsResponseListener。其中AuthInfoSisHttpConfig的参数如表1所示。

  • 录音文件极速 - 语音交互服务 SIS

    add_punc 否 String 表示是否在识别结果中添加标点,取值为“yes”“no”,默认为“no”。 digit_norm 否 String 表示是否将语音中的数字识别为阿拉伯数字,取值为“yes” “no”,默认为“yes”。 vocabulary_id 否 String

  • 一句话识别(http) - 语音交互服务 SIS

    endpoint是华为云各服务应用区域各服务的终端节点,详情请查看 地区终端节点。 请求参数 请求类为RecognizeShortAudioRequest,该类的body参数为PostShortAudioReq。 PostShortAudioReq的包含data,config两个参数,其

  • 配置热词表(可选) - 语音交互服务 SIS

    热词id可以通过控制台,或调用查询热词表信息接口获取。 图2 热词id 热词3.0 热词3.0在热词1.0基础上,增加了自定义权重热词强制替换热词来提升特定场景关键词召回率,如下图3所示。控制台后端API均已开放热词3.0的创建接口,但需注意的是,并非所有API均能使热词3.0算法生效,具体约束条件如下。

  • 计费说明 - 语音交互服务 SIS

    计费说明 计费项 一句话识别、语音合成按调用次数计费;实时语音识别、录音文件识别按音频时长计费;录音文件识别极速按照“音频时长×需要识别的音频声道数“计费,时长计算精确到秒。 按音频时长计费的,累加每次调用的音频时长。 按调用次数计费的,返回失败的调用不计入次数。 调用热词接口,不单独计费。

  • 语音合成(http) - 语音交互服务 SIS

    build(); endpoint是华为云各服务应用区域各服务的终端节点,详情请查看 地区终端节点。 请求参数 请求类为RunTtsRequest,其中包含参数类PostCustomTTSReq,该类包含两个参数text(待合成文本)TtsConfig,详见TtsConfig。 表1

  • 一句话识别(websocket) - 语音交互服务 SIS

    needWordInfo 否 String 表示是否在识别结果中输出分词结果信息,取值为“yes”“no”,默认为“no”。 建立连接 sasrWsClient.connect(); 发送开始识别指令配置信息 sasrWsClient.sendStart(getStartRequest());

  • 调用Java SDK实现一句话识别 - 语音交互服务 SIS

    API进行的封装,用户直接调用语音交互SDK提供的接口函数即可实现使用语音交互业务能力的目的,以简化用户的开发工作。SIS SDK目前支持JavaPython。 本章节提供了通过Java SDK调用一句话识别服务的样例,帮助用户快速了解如何使用Java SDK调用华为云SIS服务。具体操作如下所示: