已找到以下 165 条记录
AI智能搜索
产品选择
语音交互服务 SIS
没有找到结果,请重新输入
产品选择
语音交互服务 SIS
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 一句话识别Http接口 - 语音交互服务 SIS

    区域,如cn-north-1、cn-north-4 private String projectId = ""; // 项目id。登录管理控制台,鼠标移动到右上角用户名,在下拉列表中选择我的凭证,在项目列表中查看项目id。多项目时,展开“所属区域”,从“项目ID”列获取子项目ID。 //

  • 身份认证与访问控制 - 语音交互服务 SIS

    Key)加密调用请求。经过认证请求总是需要包含一个签名值,该签名值以请求者访问密钥(AK/SK)作为加密因子,结合请求体携带特定信息计算而成。通过访问密钥(AK/SK)认证方式进行认证鉴权,即使用Access Key ID(AK)/Secret Access Key(SK)加密方法来验证某

  • 应用场景 - 语音交互服务 SIS

    体验。 智能教育 集成语音合成教育系统可以实现中文标准朗读及带读,应用于课堂和学生自学,提升教学效率。 直播实时字幕 将视频直播或现场直播中音频实时转为字幕,为观众提供更高效观会体验,方便对直播内容进行监控。 会议实时记录 将视频或电话会议中音频实时转为文字,可实时校核、修改及检索转写会议内容,提高会议效率。

  • 基本概念 - 语音交互服务 SIS

    户提供通用云服务Region;专属Region指只承载同一类业务或只面向特定租户提供业务服务专用Region。 详情请参见区域和可用区。 可用区(AZ,Availability Zone) 一个AZ是一个或多个物理数据中心集合,有独立风火水电,AZ内逻辑再将计算、网络、

  • 什么是区域与可用区 - 语音交互服务 SIS

    器下。 资源价格 不同区域资源价格可能有差异,请参见华为云服务价格详情。 如何选择可用区 是否将资源放在同一可用区内,主要取决于您对容灾能力和网络时延要求。 如果您应用需要较高容灾能力,建议您将资源部署在同一区域不同可用区内。 如果您应用要求实例之间网络延时较低,则建议您将资源创建在同一可用区内。

  • 实时语音识别 - 语音交互服务 SIS

    区域,如cn-north-1、cn-north-4 private String projectId = ""; // 项目id。登录管理控制台,鼠标移动到右上角用户名,在下拉列表中选择我的凭证,在项目列表中查看项目id。多项目时,展开“所属区域”,从“项目ID”列获取子项目ID。 private

  • 错误码 - 语音交互服务 SIS

    invalid报错,请使用存放在OBS音频文件路径,并确保OBSregion要和请求服务region保持一致。 SIS.0535 录音文件识请求文件类型不支持。 确保设置audio_format格式值是合法。录音文件识别支持音频格式如表7所示。 确保待识别音频格式和接口参数中设置audio_format参数格式一致。

  • 配置热词表(可选) - 语音交互服务 SIS

    自定义权重热词用/将热词分为两个部分,左边即为普通热词,遵循普通热词配置规则。 右边为1~10整数(包含),数值越大热词偏置力度越强,召回率越高(但误召回风险越大)。 图4 配置示例 强制替换热词 强制替换作为热词功能补充,主要解决以下两类问题: 一些极其罕见词语,如绵绵瓜瓞,龙行龘(dá)龘,即

  • 为什么服务端返回OBS链接不可用(data url is unreachable) - 语音交互服务 SIS

    问题现象 服务后台无法访问用户提供音频OBS链接。即无法获取用户需要识别的音频文件。 解决方案 检查用户是否授权服务访问OBS。 检查存放音频OBSRegion和服务Region是否为同一区域,只有同一区域OBS才能正常访问。 检查音频OBS URI是否正确。 父主题:

  • SIS.0535报错 - 语音交互服务 SIS

    format is invalid!" 解决方案 确保设置audio_format格式值是合法,即设置格式是表1中格式。 确保待识别音频格式和接口参数中设置audio_format参数格式一致。 表1 录音文件识别支持音频格式 audioformat取值 说明 auto

  • 为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

    为什么录音文件识别出现重复转写结果 问题现象 调用录音文件识别接口,识别的结果出现两条完全一致结果。 解决方案 由于声道设置原因,单声道音频按照双声道处理了。 在请求中将参数“channel”值修改成“MONO”或者直接去掉请求参数中“channel”项。 父主题: API使用类

  • 监控安全风险 - 语音交互服务 SIS

    SIS提供基于云监控服务CES监控能力,帮助用户监控账号下SIS服务API,执行自动实时监控、告警和通知操作。用户可以实时掌握API所产生调用成功次数、调用失败次数等信息。 关于SIS支持监控指标,以及如何创建监控告警规则等内容,请参见语音交互服务监控指标。 同时,SIS控

  • 语音合成 - 语音交互服务 SIS

    项目id。登录管理控制台,鼠标移动到右上角用户名,在下拉列表中选择我的凭证,在项目列表中查看项目id。多项目时,展开“所属区域”,从“项目ID”列获取子项目ID。 private String text = ""; // 待合成文本 private String

  • SSML标记语言介绍 - 语音交互服务 SIS

    Language)标记语言功能、标签使用及示例。 概述 SSML 是一种基于 XML 语音合成标记语言。使用 SSML 可以更加准确、具体定义合成音频效果,包括控制断句分词方式、发音、速度、停顿、声调和音量等特征。相比文本输入进行合成,有更好操作灵活性。 华为云语音合成服务SSML实现,基于W3C的语音合成标记语言版本1

  • 调用Java SDK实现一句话识别 - 语音交互服务 SIS

    SDK)是对语音交互服务提供REST API进行封装,用户直接调用语音交互SDK提供接口函数即可实现使用语音交互业务能力目的,以简化用户开发工作。SIS SDK目前支持Java和Python。 本章节提供了通过Java SDK调用一句话识别服务样例,帮助用户快速了解如何使用Java

  • 热词管理 - 语音交互服务 SIS

    isConfig。 表1 AuthInfo 参数名称 是否必选 参数类型 描述 ak 是 String 用户ak,可参考AK/SK认证。 sk 是 String 用户sk,可参考AK/SK认证。 region 是 String 区域,如cn-north-4,参考终端节点。 projectId

  • 如何修改发音人 - 语音交互服务 SIS

    如何修改发音人 修改代码中property取值即可,支持发音人如表1和表2所示。 POST https://{endpoint}/v1/{project_id}/tts Request Header: Content-Type: application/json X-Auth-Token:

  • 配置OBS访问权限 - 语音交互服务 SIS

    、高可靠、低成本数据存储能力,可供用户存储任意类型和大小数据。 EI企业智能服务对于图片、语音等多媒体文件支持直接使用华为云OBS服务数据处理方式,以减少服务使用成本,降低服务响应时长,提升服务使用体验。语音交互服务优先推荐使用同一region下OBS音频链接作为传入音频的URL。

  • 语音合成 - 语音交互服务 SIS

    语音合成,是一种将文本转换成逼真语音服务。用户通过实时访问和调用API获取语音合成结果,将用户输入文字合成为音频。通过音色选择、自定义音量、语速,为企业和个人提供个性化发音服务。该接口使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了语音合成在线使用页面,用户无需编程即可使用服务功能。

  • 功能介绍 - 语音交互服务 SIS

    一句话识别 可以实现1分钟以内音频到文字转换。对于用户上传二进制音频格式数据,系统经过处理,生成语音对应文字,支持语言包含中文普通话、方言以及英语。方言当前支持四川话、粤语和上海话。 产品优势 高识别率 基于深度学习技术,对特定领域场景语音识别进行优化,识别率达到业界领先。