已找到以下 167 条记录
AI智能搜索
产品选择
语音交互服务 SIS
没有找到结果,请重新输入
产品选择
语音交互服务 SIS
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 配置CPP环境(Linux) - 语音交互服务 SIS

    gcc-c++ 版本需要在5.4.0及以上 Linux版本CPP SDK依赖g++,cmake,此三项需要提前在机器安装,才能完成sdk编译运行. CentOS yum install gcc-c++ yum install cmake Ununtu sudo apt-get install

  • 录音文件识别多久可以返回结果 - 语音交互服务 SIS

    录音文件识别多久可以返回结果 音频转写时长受音频时长排队任务数量影响,音频时长理论返回时间可参见表 音频转写时长参考表。如果转写耗时比理论时延长,大概率表示当前时间段出现转写高峰,请耐心等待,我们承诺最大转写时长不超过6小时。 表1 音频转写时长参考表 音频时长 参考返回时间

  • 实时语音识别连续模式 - 语音交互服务 SIS

    初始化Client 初始化RASRClient,参数为AuthInfoRASRConfig。 表1 AuthInfo 参数名称 是否必选 参数类型 描述 ak 是 String 用户ak,可参考AK/SK认证。 sk 是 String 用户sk,可参考AK/SK认证。 region 是 String

  • Websocket握手请求 - 语音交互服务 SIS

    账户创建企业项目后,在传参时,有以下三类场景。 携带正确ID,正常使用SIS服务,账单归到企业ID对应企业项目中。 携带错误ID,正常使用SIS服务,账单企业项目会被分类为“default”。 不携带ID,正常使用SIS服务,账单企业项目会被分类为“default”。 请求示例(伪码)

  • 语音合成 - 语音交互服务 SIS

    // 认证用aksk硬编码到代码中或者明文存储都有很大安全风险,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全; // 本示例以aksk保存在环境变量中来实现身份验证为例,运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_AKHUAWEICLOUD_SDK_SK。

  • 实时语音合成 - 语音交互服务 SIS

    // 认证用aksk硬编码到代码中或者明文存储都有很大安全风险,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全; // 本示例以aksk保存在环境变量中来实现身份验证为例,运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_AKHUAWEICLOUD_SDK_SK。

  • 录音文件极速版 - 语音交互服务 SIS

    // 认证用aksk硬编码到代码中或者明文存储都有很大安全风险,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全; // 本示例以aksk保存在环境变量中来实现身份验证为例,运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_AKHUAWEICLOUD_SDK_SK。

  • 热词管理 - 语音交互服务 SIS

    热词可在一句话识别、录音文件识别、实时语音识别使用。例如将地名人名作为热词,则语音可以准确识别出人名地名。 * Copyright 2021 Huawei Technologies Co.,Ltd. */ public class HotWordDemo { // 认证用aksk硬编码到代码中或者明文

  • 录音文件识别 - 语音交互服务 SIS

    // 认证用aksk硬编码到代码中或者明文存储都有很大安全风险,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全; // 本示例以aksk保存在环境变量中来实现身份验证为例,运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_AKHUAWEICLOUD_SDK_SK。

  • 示例音频 - 语音交互服务 SIS

    示例音频 测试音频如表 示例音频所示,音频文件标题表示采样率位宽。如8k16bit.pcm表示音频采样率为8k,位宽为16bit。 表1 示例音频 音频格式 下载链接 mp3 https://sis-sample-audio.obs.cn-north-1.myhuaweicloud

  • 示例音频 - 语音交互服务 SIS

    示例音频 测试音频如表 示例音频所示,音频文件标题表示采样率位宽。如8k16bit.pcm表示音频采样率为8k,位宽为16bit。 表1 示例音频 音频格式 下载链接 mp3 https://sis-sample-audio.obs.cn-north-1.myhuaweicloud

  • 一句话识别 - 语音交互服务 SIS

    } //认证用AKSK硬编码在代码中或明文存储都有很大安全风险,建议在配置文件或环境变量中密文存放,使用时解密,确保安全。 //本示例以AKSK保存在环境变量中来实现身份验证为例,运行本示例请先在本

  • APIG.0201报错 - 语音交互服务 SIS

    0201",表示请求超时。 您可以尝试以下方案进行解决。 使用Postman等工具直接调用服务,查看是否成功,如果调用成功表示服务接口没有问题,请执行如下步骤1步骤2进行检查: 请检查原调用请求是否过于频繁,如果是并发过大,可以通过重试机制解决,在代码里检查返回值,碰到这个并发错误可以延时一小段时间

  • 基本概念 - 语音交互服务 SIS

    一个AZ是一个或多个物理数据中心集合,有独立风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统需求。 项目 华为云区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间资源(计算资源、存

  • 为什么服务端返回OBS链接不可用(data url is unreachable) - 语音交互服务 SIS

    问题现象 服务后台无法访问用户提供音频OBS链接。即无法获取用户需要识别的音频文件。 解决方案 检查用户是否授权服务访问OBS。 检查存放音频OBSRegion和服务Region是否为同一区域,只有同一区域OBS才能正常访问。 检查音频OBS URI是否正确。 父主题:

  • 应用场景 - 语音交互服务 SIS

    体验。 智能教育 集成语音合成教育系统可以实现中文标准朗读及带读,应用于课堂学生自学,提升教学效率。 直播实时字幕 将视频直播或现场直播中音频实时转为字幕,为观众提供更高效观会体验,方便对直播内容进行监控。 会议实时记录 将视频或电话会议中音频实时转为文字,可实时校核、修改及检索转写会议内容,提高会议效率。

  • SSML标记语言介绍 - 语音交互服务 SIS

    Language)标记语言功能、标签使用及示例。 概述 SSML 是一种基于 XML 语音合成标记语言。使用 SSML 可以更加准确、具体定义合成音频效果,包括控制断句分词方式、发音、速度、停顿、声调和音量等特征。相比文本输入进行合成,有更好操作灵活性。 华为云语音合成服务SSML实现,基于W3C的语音合成标记语言版本1

  • 配置热词表(可选) - 语音交互服务 SIS

    0基础上,增加了自定义权重热词强制替换热词来提升特定场景关键词召回率,如下图3所示。控制台后端API均已开放热词3.0创建接口,但需注意是,并非所有API均能使热词3.0算法生效,具体约束条件如下。 图3 创建热词表 支持region: 北京四、上海一 支持API: 实时语音识

  • 错误码 - 语音交互服务 SIS

    invalid报错,请使用存放在OBS音频文件路径,并确保OBSregion要和请求服务region保持一致。 SIS.0535 录音文件识请求文件类型不支持。 确保设置audio_format格式值是合法。录音文件识别支持音频格式如表7所示。 确保待识别音频格式接口参数中设置audio_format参数格式一致。

  • 为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

    为什么录音文件识别出现重复转写结果 问题现象 调用录音文件识别接口,识别的结果出现两条完全一致结果。 解决方案 由于声道设置原因,单声道音频按照双声道处理了。 在请求中将参数“channel”值修改成“MONO”或者直接去掉请求参数中“channel”项。 父主题: API使用类