检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建语音通知(V2.0.0)(createVoiceNotification) 场景描述 使用语音通知功能时,调用此API,将请求语音通话平台给指定用户播放语音通知。 创建语音通知(V2)接口对比原创建语音通知接口,其请求参数中的语音文件设置方式不同,现支持设置文本转语音的模板和
在流式一句话模式下: 不会返回VOICE_START、VOICE_END、EXCEEDED_SILCENCE事件。 在实时语音识别单句模式下: 返回VOICE_START事件,表示检测到语音,此时IVR可以做打断。 返回VOICE_END事件后,表示一句话结束,后续的音频将被忽略,不会再进行识别。
实时语音识别请求 实时语音识别工作流程 开始识别 发送音频数据 结束识别 父主题: 实时语音识别接口
实时语音识别连续模式 功能介绍 连续识别模式的语音总长度限制为五小时,适合于会议、演讲和直播等场景。 连续识别模式在流式识别的基础上,结合了语音的端点检测功能。语音数据也是分段输入,但是连续识别模式将会在处理数据之前进行端点检测,如果是语音才会进行实际的解码工作,如果检测到静音,
方案概述 应用场景 该解决方案基于华为云语音交互服务语音识别构建,可自动将用户上传到对象存储服务的wav语音文件转化为文字,并将结果存放到指定OBS桶。该方案可以将用户上传在OBS的语音文件识别成可编辑的文本,支持中文普通话的识别和合成,其中语音识别还支持带方言口音的普通话识别以及方
与实时语音识别引擎握手连接,并发送语音数据和接收转写结果,最后关闭Websocket连接。 获取Websocket握手请求wss-URI请参见Websocket握手请求。 获取实时语音识别请求消息格式信息请参见实时语音识别请求。 获取实时语音识别响应消息格式请参见实时语音识别响应。
语音验证码API 语音验证码API使用说明 语音验证码场景API 语音验证码呼叫状态通知API 语音验证码话单通知API
语音验证码API使用说明 API列表 API名称 API功能 语音验证码场景API 请求语音通话平台向指定用户播放语音验证码。 语音验证码呼叫状态通知API 语音通话平台向SP推送接收语音通话业务用户呼叫时的状态信息,如呼入、呼出、振铃、应答、挂机等状态的信息。 语音验证码话单通知API
业务公司服务器成功登录语音通话平台。 业务公司服务器发起语音通知请求,请求语音通话平台向Jane播放业务公司定制的欠费通知。 业务公司服务器调用“语音通知API”实现整个呼叫过程。 语音通话平台呼叫Jane。 Jane接听。 语音通话平台向Jane播放业务公司定制的欠费通知。 J
如何查看语音模板内容?是否支持下载或迁移? 已添加成功的语音模板内容可在语音模板管理页面查看。 不支持下载。不支持华为云账号之间的迁移,同一个语音模板可供同一个华为云账号下的不同应用使用。 父主题: 放音文件及语音模板配置
BS桶中获取结果,即可实现隐私通话内容的自动化处理流程。SDK详细使用流程可参考OBS SDK用户指南。 结果示例 客服中心语音质检结果如下所示,支持语音识别结果、原始录音文件地址、录音时长、规则命中结果、命中位置等多个字段。 { 'asr_result': {
chinese_16k_it 支持采样率为16k的IT会议语音识别。区域仅支持cn-north-4。 chinese_8k_common 支持采样率为8k的中文普通话语音识别。 chinese_16k_common 支持采样率为16k的中文普通话语音识别。 表4 audio_format取值范围
录音文件识别 支持“华北-北京四”、“华东-上海一”区域。 当前语音服务仅支持北京和上海区域,后续会陆续上线其他区域。 华北-北京四,推荐的区域。 华东-上海一,推荐的区域。 支持pcm16k16bit、pcm8k16bit、ulaw16k8bit、ulaw8k8bit、alaw
0002", "error_msg": "***" } 状态码 状态码请参见状态码。 错误码 错误码请参见错误码。 父主题: 实时语音识别响应
开启语音接收 产品即将到期通知、资源包使用量已用完提醒两个消息类型的语音通知默认打开,其他消息类型的语音通知默认关闭。当前支持语音通知的消息类型,包括如下: 消息类型 消息介绍 产品即将到期通知 云服务到期前3天会提醒您及时续费。 产品即将释放通知 云服务释放前3天会提醒您及时续
cancel 否 Boolen 是否取消返回识别结果。 true:表示取消识别,也即丢弃识别中和未识别的语音数据并结束,不返回剩余的识别结果。 false:表示继续处理识别中和未识别的语音数据直到处理完所有之前发送的数据。 默认是false。 示例 { "command": "END"
SSML 是一种基于 XML 的语音合成标记语言。使用 SSML 可以更加准确、具体的定义合成音频的效果,包括控制断句分词方式、发音、速度、停顿、声调和音量等特征。相比文本输入进行合成,有更好的操作灵活性。 华为云语音合成服务的SSML实现,基于W3C的语音合成标记语言版本1.1,但并
实施步骤 准备工作 快速部署 开始使用 快速卸载
(.) 空 channel String 必填 语音文件声道信息,可设置为MONO,LEFT_AGENT, RIGHT_AGENT。如果channel 为MONO,那么原始文件需要为单声道文件。LEFT_AGENT 指定左声道语音为agent(坐席)。RIGHT_AGENT 指定右声道为agent(坐席)。如果
放音文件和语音模板必须要审核通过后才可使用吗? 是的。 放音文件需按要求制作,请参考制作放音文件。并通过放音文件管理页面提前上传到语音通话平台并通过审核后才可使用。 语音模板需通过语音模板管理页面提前上传到语音通话平台并通过审核后才可使用。 父主题: 放音文件及语音模板配置