已找到以下 164 条记录
AI智能搜索
产品选择
语音交互服务 SIS
没有找到结果,请重新输入
产品选择
语音交互服务 SIS
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 监控安全风险 - 语音交互服务 SIS

    SIS提供基于云监控服务CES监控能力,帮助用户监控账号下SIS服务API,执行自动实时监控、告警和通知操作。用户可以实时掌握API所产生调用成功次数、调用失败次数等信息。 关于SIS支持监控指标,以及如何创建监控告警规则等内容,请参见语音交互服务监控指标。 同时,SIS控

  • 责任共担 - 语音交互服务 SIS

    华为云:负责云服务自身安全,提供安全云。华为云安全责任在于保障其所提供IaaS、PaaS和SaaS类云服务自身安全,涵盖华为云数据中心物理环境设施和运行其上基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术安全功能和性能本身,也包括运维运营安全,以及更广义的安全合规遵从。

  • 为什么服务端返回OBS链接不可用(data url is unreachable) - 语音交互服务 SIS

    问题现象 服务后台无法访问用户提供音频OBS链接。即无法获取用户需要识别的音频文件。 解决方案 检查用户是否授权服务访问OBS。 检查存放音频OBSRegion和服务Region是否为同一区域,只有同一区域OBS才能正常访问。 检查音频OBS URI是否正确。 父主题:

  • SSML标记语言介绍 - 语音交互服务 SIS

    Language)标记语言功能、标签使用及示例。 概述 SSML 是一种基于 XML 语音合成标记语言。使用 SSML 可以更加准确、具体定义合成音频效果,包括控制断句分词方式、发音、速度、停顿、声调和音量等特征。相比文本输入进行合成,有更好操作灵活性。 华为云语音合成服务SSML实现,基于W3C的语音合成标记语言版本1

  • SIS.0535报错 - 语音交互服务 SIS

    format is invalid!" 解决方案 确保设置audio_format格式值是合法,即设置格式是表1中格式。 确保待识别音频格式和接口参数中设置audio_format参数格式一致。 表1 录音文件识别支持音频格式 audioformat取值 说明 auto

  • 为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

    为什么录音文件识别出现重复转写结果 问题现象 调用录音文件识别接口,识别的结果出现两条完全一致结果。 解决方案 由于声道设置原因,单声道音频按照双声道处理了。 在请求中将参数“channel”值修改成“MONO”或者直接去掉请求参数中“channel”项。 父主题: API使用类

  • 配置OBS访问权限 - 语音交互服务 SIS

    、高可靠、低成本数据存储能力,可供用户存储任意类型和大小数据。 EI企业智能服务对于图片、语音等多媒体文件支持直接使用华为云OBS服务数据处理方式,以减少服务使用成本,降低服务响应时长,提升服务使用体验。语音交互服务优先推荐使用同一region下OBS音频链接作为传入音频的URL。

  • 应用场景 - 语音交互服务 SIS

    体验。 智能教育 集成语音合成教育系统可以实现中文标准朗读及带读,应用于课堂和学生自学,提升教学效率。 直播实时字幕 将视频直播或现场直播中音频实时转为字幕,为观众提供更高效观会体验,方便对直播内容进行监控。 会议实时记录 将视频或电话会议中音频实时转为文字,可实时校核、修改及检索转写会议内容,提高会议效率。

  • 语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

    语音识别是强制绑定使用OBS进行录音文件存储吗 不是,只有录音文件识别需要使用OBS服务,语音交互服务对用户存储在OBS数据,具有只读权限,没有修改和删除权限。所以用户是否删除上传至OBS服务数据,需要用户根据自己obs桶使用情况或者容量大小确认,并在OBS服务上执行。 父主题: 权限类

  • 功能介绍 - 语音交互服务 SIS

    一句话识别 可以实现1分钟以内音频到文字转换。对于用户上传二进制音频格式数据,系统经过处理,生成语音对应文字,支持语言包含中文普通话、方言以及英语。方言当前支持四川话、粤语和上海话。 产品优势 高识别率 基于深度学习技术,对特定领域场景语音识别进行优化,识别率达到业界领先。

  • APIG.0101报错 - 语音交互服务 SIS

    0101报错 访问API不存在或尚未在环境中发布。The API does not exist or has not been published in the environment. 请检查APIURL是否拼写正确,例如,URL中是否缺少project_id。 检查URI中endp

  • 如何通过主账号创建一个子账号 - 语音交互服务 SIS

    如何通过主账号创建一个子账号 语音交互服务服务不支持IAM细粒度划分策略,IAM账号与主账号具备相同操作权限。 您可以使用IAM用户管理功能,给员工或应用程序创建IAM用户,可避免分享自己账号密码。详细创建步骤请参见创建IAM用户。 父主题: 权限类

  • 接口说明 - 语音交互服务 SIS

    模式”、“实时语音识别单句模式”三种模式。 三种模式握手请求wss-URI不同,基于Websocket承载实时语音识别请求和响应消息格式相同。 开发者可以使用java、python、c++等开发语言支持Websocket对应软件包或库接口,与实时语音识别引擎握手连接,并发

  • 如何修改发音人 - 语音交互服务 SIS

    如何修改发音人 修改代码中property取值即可,支持发音人如表1和表2所示。 POST https://{endpoint}/v1/{project_id}/tts Request Header: Content-Type: application/json X-Auth-Token:

  • 创建企业项目 - 语音交互服务 SIS

    FullAccess权限用户。 企业账号可申请开通企业项目。账号需要进行企业实名认证。如果企业账号注册成为华为云合作伙伴,将无法进入企业项目管理页面。 图1 操作流程 创建企业项目 登录控制台,单击界面右上方“企业 > 项目管理”。 屏幕分辨率低情况下单击页面右上方“更多 > 企业

  • 计费说明 - 语音交互服务 SIS

    或时长。 购买套餐包在生效期内,扣费方式是先扣除已购买套餐包内额度后,超出部分以按需计费方式进行结算。 购买套餐包到期后如果没有购买新套餐包,系统会自动转为按需计费。 变更配置 SIS默认使用按需计费。您也可以根据您实际情况购买资源包,购买后对应区域资源将自动转为

  • 发送音频数据 - 语音交互服务 SIS

    建议在需要实时反馈情况下100ms,不需要实时反馈情况下500ms。实时语音识别代码示例请参考SDK文档。 当前SIS服务对于8k音频分片大小限制为[160, 32768]字节, 16k音频分片大小限制为[320, 65536]字节, 分片大小超出上限或低于下限会报错。

  • 语音合成 - 语音交互服务 SIS

    语音合成,是一种将文本转换成逼真语音服务。用户通过实时访问和调用API获取语音合成结果,将用户输入文字合成为音频。通过音色选择、自定义音量、语速,为企业和个人提供个性化发音服务。该接口使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了语音合成在线使用页面,用户无需编程即可使用服务功能。

  • SIS.0032报错 - 语音交互服务 SIS

    mp3格式音频。目前仅支持单通道音频。 aac aac格式音频。目前仅支持单通道音频。 wav 带wav封装头格式,从封装头中自动确定格式,目前仅支持8k/16k采样率、单通道、pcm, alaw, ulaw三种编码格式。 amr AMR窄带(8k) 压缩录音数据。目前仅支持单通道音频。 amrwb

  • 创建热词表 - 语音交互服务 SIS

    在一句话识别、录音文件识别、实时语音识别服务中,如果在您业务领域有一些特有的词,默认识别效果差时候可以考虑使用热词管理功能,将这些词添加到词表,改善识别效果。 热词可以是姓名、公司名、某个领域专有名词,如人名"王晓茗”(通常会识别为"王小明”)、运输域“高栏”等。热词不建议太长,也不要有标