已找到以下 143 条记录
AI智能搜索
产品选择
语音交互服务 SIS
没有找到结果,请重新输入
产品选择
语音交互服务 SIS
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 配置OBS访问权限 - 语音交互服务 SIS

    开启公共授权,则数据全网可见,所有用户均可访问,不推荐使用此方法,该方法仅针对同一region服务有效。 配置公共读可参考配置标准桶策略,创建桶策略为“公共读”。一般私密数据不建议用此方法。 目前仅支持访问用户个人OBS下音频链接,不支持读取其他用户公共读链接。 图1 创建“公共读”桶策略 开启语音交互服务授权

  • 身份认证与访问控制 - 语音交互服务 SIS

    Key(SK)加密的方法来验证某个请求发送者身份。关于访问密钥详细介绍及获取方式,请参见认证鉴权。 访问控制 SIS支持通过权限控制(IAM权限)进行访问控制。 表1 表1 SIS访问控制 访问控制方式 简要说明 权限控制 IAM权限 IAM权限是作用于云资源,IAM权限定义了允许拒绝访问操作,以此实现云资

  • 录音文件识别 - 语音交互服务 SIS

    确保已存在待识别的音频文件并上传OBS或者有公网可访问服务器上(需保证可使用域名访问),示例音频可参考下载SDK压缩包文件。如果音频存放在OBS上,确保服务已授权访问OBS,可参考配置OBS服务。 初始化Client 初始化AsrCustomizationClient,其参数包括AuthInfoSisConfig。

  • 录音文件识别 - 语音交互服务 SIS

    SDK仅支持Python3。 确保已存在待识别的音频文件并上传OBS或者有公网可访问服务器上(需保证可使用域名访问),示例音频可参考下载SDK压缩包文件。如果音频存放在OBS上,确保服务已授权访问OBS,可参考配置OBS服务。 初始化Client 初始化AsrCustomizationClient详见表

  • 提交录音文件识别任务 - 语音交互服务 SIS

    该接口用于提交录音文件识别任务,其中录音文件保存在用户OBS桶中或公网可访问服务器上(需保证可使用域名访问)。用户开通录音识别服务时,如果录音文件存放在OBS桶中,需授权录音文件引擎读取用户OBS桶权限,授权方法见配置OBS访问权限。该接口使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。

  • 调用语音交互API超时怎么处理(connect timeout) - 语音交互服务 SIS

    调用语音交互API超时怎么处理(connect timeout) 问题现象 超时通常是由于网络不通造成,需要对网络环境代码进行具体分析。 解决方案 检查网络是否正常。 确保网络正常连接互联网,正常访问华为云官网,成功获取Token等。如果使用代理,需要保证代理可用性。 检查url是否存在错误。

  • 为什么服务端返回OBS链接不可用(data url is unreachable) - 语音交互服务 SIS

    unreachable) 问题现象 服务后台无法访问用户提供音频OBS链接。即无法获取用户需要识别的音频文件。 解决方案 检查用户是否授权服务访问OBS。 检查存放音频OBSRegion和服务Region是否为同一区域,只有同一区域OBS才能正常访问。 检查音频OBS URI是否正确。 父主题:

  • AK/SK认证 - 语音交互服务 SIS

    使用AK/SK方式,需要用户提供AKSK。 注册登录华为云管理控制台。 在控制台中,鼠标移动至右上角用户名处,在下拉列表中单击“我的凭证”。 单击“访问密钥”页签,在页签中,单击“新增访问密钥”。 在“身份验证”对话框中,输入当前用户登录密码,通过邮箱或者手机进行验证,输入对应验证码。

  • 什么是语音交互服务 - 语音交互服务 SIS

    用户通过调用API接口,将语音文件识别成可编辑文本,然后返回JSON格式识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 首次使用SIS 如果您是首次使用SIS用户,建议您学习并了解如下信息: 功能介绍 通过功能介绍章节内容,了解SIS不同功能具体介绍,主要包括实时语音识别(Real-time

  • 基本概念 - 语音交互服务 SIS

    份凭证(密码访问密钥)。 在我的凭证下,您可以查看账号ID用户ID。通常在调用API鉴权过程中,您需要用到账号、用户密码等信息。 区域(Region) 从地理位置网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服

  • 配置Java环境 - 语音交互服务 SIS

    在Eclipse官网下载对应平台Eclipse版本,比如:eclipse-jee-mars-R-win32-x86_64.zip。 Idea 在Idea官网下载对应平台idea版本,比如:ideaIU-2023.2.2.exe。 导入SDK Eclipse导入SDK。 解压eclipse后,直接打开。同时下载SDK。

  • 功能介绍 - 语音交互服务 SIS

    功能介绍 实时语音识别 实时语音识别服务,用户通过实时访问调用API获取实时语音识别结果,支持语言包含中文普通话、方言和英语,方言当前支持四川话、粤语上海话。 文本时间戳 为音频转换结果生成特定时间戳,从而通过搜索文本即可快速找到对应原始音频。 智能断句 通过提取上下文相关

  • There was a bad response from the server报错 - 语音交互服务 SIS

    server报错。表示无法正常连接到SIS服务。 请先检查您华为云账号是否已经进行了实名认证。 如果您网络环境异常也会引发该报错,请确保您网络连接正常,可以访问SIS服务。如果使用是局域网或内部网络,请确保可以正常访问公网。 网络环境如果正常,请检查代码示例中endpoint

  • 什么是区域与可用区 - 语音交互服务 SIS

    一般情况下,建议就近选择靠近您或者您目标用户区域,这样可以减少网络时延,提高访问速度。不过,在基础设施、BGP网络品质、资源操作与配置等方面,中国大陆各个区域间区别不大,如果您或者您目标用户在中国大陆,可以不用考虑不同区域造成网络时延问题。 在除中国大陆以外亚太地区有业务用户,可以选择“

  • 语音交互服务区域如何选择 - 语音交互服务 SIS

    语音交互服务区域如何选择 不同区域资源之间内网不互通。为保证网络连通性,降低网络时延、提高访问速度,请选择靠近您客户区域,当前语音服务支持北京上海区域,后续会陆续上线其他区域,当前支持区域请参见地区与终端节点。 华北-北京四,为推荐区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

  • 录音文件极速版 - 语音交互服务 SIS

    // 认证用aksk硬编码到代码中或者明文存储都有很大安全风险,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全; // 本示例以aksk保存在环境变量中来实现身份验证为例,运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_AKHUAWEICLOUD_SDK_SK。

  • 语音合成 - 语音交互服务 SIS

    语音合成,是一种将文本转换成逼真语音服务。用户通过实时访问调用API获取语音合成结果,将用户输入文字合成为音频。通过音色选择、自定义音量、语速,为企业个人提供个性化发音服务。该接口使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了语音合成在线使用页面,用户无需编程即可使用服务功能。

  • 配置Python环境 - 语音交互服务 SIS

    操作步骤 下载SDK,通过pip-list命令查看安装包。若未安装,则执行以下命令: pip install setuptools pip install requests pip install websocket-client 进入下载Python SDK目录,在setup

  • 调用语音交互API显示auth failed - 语音交互服务 SIS

    检查获取Token是否正常。 确保获取Token为24小时之内Token。 确保获取Token参数嵌套是否正确。 正确嵌套应该如下列代码示例所示,错误嵌套也能获取Token,但无法访问服务。 使用AK/SK方式访问,检查AKSK是否填写正确。 检查“project_id”是否填

  • 概述 - 语音交互服务 SIS

    语音合成/实时语音合成 语音合成,依托先进语音技术,使用深度学习算法,将文本转换为自然流畅语音。用户通过实时访问调用API获取语音合成结果,将用户输入文字合成为音频。通过音色选择、自定义音量、语速、音高等,可自定义音频格式,为企业个人提供个性化发音服务。 父主题: 使用前必读