已找到以下 168 条记录
产品选择
语音交互服务 SIS
没有找到结果,请重新输入
产品选择
语音交互服务 SIS
产品选择
没有找到结果,请重新输入
  • 概述 - 语音交互服务 SIS

    语音合成/实时语音合成 语音合成,依托先进语音技术,使用深度学习算法,将文本转换为自然流畅语音。用户通过实时访问调用API获取语音合成结果,将用户输入文字合成为音频。通过音色选择、自定义音量、语速、音高等,可自定义音频格式,为企业个人提供个性化发音服务。 父主题: 使用前必读

  • 什么是语音交互服务 - 语音交互服务 SIS

    Service,简称SIS)是一种人机交互方式,用户通过实时访问调用API(Application Programming Interface,应用程序编程接口)获取语音交互结果。例如用户通过语音识别功能,将口述音频、普通话或者带有一定方言语音文件识别成可编辑文本,同时也支持通过语音合成功能将文本转

  • 查看套餐用量明细、账单明细 - 语音交互服务 SIS

    登录SIS服务控制台。 单击左侧导航栏“套餐包 > 套餐包管理”,进入“费用中心 > 资源包”页面查看套餐包用量,在“费用中心 > 账单管理”查看账单明细。 资源包列会展示全部云服务,请按照订购资源包名称进行搜索。 图1 资源包列表 父主题: 计费类

  • 开始识别请求响应 - 语音交互服务 SIS

    开始识别请求响应 由于WebSocket是全双工,因此响应就是从服务器端发送给客户端消息,但也并不是所有的请求信息都有一条对应响应。服务器端收到“开始识别”请求时,会给出如下响应消息,以json字符串形式放置在text message。 响应消息 表1 响应参数 参数名 参数类型

  • 识别结果响应 - 语音交互服务 SIS

    String 服务内部令牌,可用于在日志追溯具体流程。 segments Array of objects 多句结果。 请参考表 segment 数据结构。 表2 segment 数据结构 参数名 参数类型 说明 start_time Integer 相对时间戳,表示一句起始,单位为ms。

  • 语音交互服务需要申请什么权限 - 语音交互服务 SIS

    当用户需要使用录音文件识别功能时,需要用户具有主账号或者Security Administrator权限。 因为录音文件保存在用户OBS(Object Storage Service,对象存储服务)桶。考虑到数据安全,语音交互服务无法直接获取到用户数据,需要用户授权录音文件引擎读取用户OBS

  • 获取AK/SK - 语音交互服务 SIS

    credential.csv文件内容 AK/SK生成步骤: 登录管理控制台。 单击右上角用户名,在下拉列表单击“我的凭证”。 单击“访问密钥”。 单击“新增访问密钥”。 依据界面提示,获取并下载秘钥,请妥善保管。 图2 获取访问秘钥 父主题: 附录

  • SDK简介 - 语音交互服务 SIS

    Interaction Service,简称SIS)是一种人机交互方式,用户通过实时访问调用API获取语音交互结果。支持用户通过语音识别功能,将口述音频、普通话或者带有一定方言语音文件识别成可编辑文本,同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音

  • 一句话识别Http接口 - 语音交互服务 SIS

    import os # 鉴权参数 # 认证用aksk硬编码到代码或者明文存储都有很大安全风险,建议在配置文件或者环境变量密文存放,使用时解密,确保安全; # 本示例以aksk保存在环境变量来实现身份验证为例,运行本示例前请先在本地环境设置环境变量HUAWEICLOUD_

  • 录音文件极速版 - 语音交互服务 SIS

    import os # 鉴权参数 # 认证用aksk硬编码到代码或者明文存储都有很大安全风险,建议在配置文件或者环境变量密文存放,使用时解密,确保安全; # 本示例以aksk保存在环境变量来实现身份验证为例,运行本示例前请先在本地环境设置环境变量HUAWEICLOUD_S

  • 录音文件识别极速版接口 - 语音交互服务 SIS

    wav。如果上传至OBS桶文件或OBS路径为中文,obs_object_key值需要采用中文形式。 obs_object_key 是 String 表示OBS对象桶对象键值,长度小于1024个字符,需要进行urlencode编码。 OBS桶区域需要与接口地址区域一致。 示例:

  • 创建热词表 - 语音交互服务 SIS

    在一句话识别、录音文件识别、实时语音识别服务,如果在您业务领域有一些特有的词,默认识别效果差时候可以考虑使用热词管理功能,将这些词添加到词表,改善识别效果。 热词可以是姓名、公司名、某个领域专有名词,如人名"王晓茗”(通常会识别为"王小明”)、运输域“高栏”等。热词不建议太长,也不

  • 配置CPP环境(Linux) - 语音交互服务 SIS

    本SDK所依赖三方库包含 - openssl - jsoncpp - websocketpp - glog - gflags - boost 依赖库均以源码形式存放在SDK根目录,SDK默认是开启所有依赖库安装,即运行cmake命令时,SDK会默认安装这些依赖库。 如果您在系统已安装

  • 错误码 - 语音交互服务 SIS

    invalid报错,请使用存放在OBS音频文件路径,并确保OBSregion要和请求服务region保持一致。 SIS.0535 录音文件识请求文件类型不支持。 确保设置audio_format格式值是合法。录音文件识别支持音频格式如表7所示。 确保待识别音频格式接口参数设置audio_format参数格式一致。

  • 数据保护技术 - 语音交互服务 SIS

    在使用语音交互服务过程中委托我们处理语音音频和文本等数据,您完全拥有上述数据所有权及控制权,您应自行对上述数据来源获取合法性负责,华为云受托处理您数据,以实现本服务功能或目的: (1)将语音音频数据识别转换成文本。 (2)将文本数据合成语音。 您上述数据将在中华人民共和国境内

  • 获取项目ID - 语音交互服务 SIS

    cts”,其中{Endpoint}为IAM终端节点。接口认证鉴权请参见认证鉴权。 响应示例如下,例如,语音交互服务部署区域为“cn-north-4”,响应消息体查找“name”为“cn-north-4”,其中projects下“id”即为项目ID。 { "projects":

  • 一句话识别Websocket接口 - 语音交互服务 SIS

    // 认证用aksk硬编码到代码或者明文存储都有很大安全风险,建议在配置文件或者环境变量密文存放,使用时解密,确保安全; // 本示例以aksk保存在环境变量来实现身份验证为例,运行本示例前请先在本地环境设置环境变量HUAWEICLOUD_SDK_AKHUAWEICLOUD_SDK_SK。

  • 返回结果 - 语音交互服务 SIS

    返回结果 状态码 请求发送以后,您会收到响应,包含状态码、响应消息头消息体。 状态码是一组从1xx到5xx数字代码,状态码表示了请求响应状态,完整状态码列表请参见状态码。 对于SIS服务接口,如果调用后返回状态码为“200”,则表示请求成功。 响应消息头 对应请求消息头,

  • 实时语音识别 - 语音交互服务 SIS

    import os # 鉴权参数 # 认证用aksk硬编码到代码或者明文存储都有很大安全风险,建议在配置文件或者环境变量密文存放,使用时解密,确保安全; # 本示例以aksk保存在环境变量来实现身份验证为例,运行本示例前请先在本地环境设置环境变量HUAWEICLOUD_

  • 录音文件识别多久可以返回结果 - 语音交互服务 SIS

    录音文件识别多久可以返回结果 音频转写时长受音频时长排队任务数量影响,音频时长理论返回时间可参见表 音频转写时长参考表。如果转写耗时比理论时延长,大概率表示当前时间段出现转写高峰,请耐心等待,我们承诺最大转写时长不超过6小时。 表1 音频转写时长参考表 音频时长 参考返回时间