正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
会议实时记录 将视频或电话会议中的音频实时转为文字,可实时校核、修改及检索转写会议内容,提高会议效率。 即时文本录入 手机App上实时录音并即时提供转写的文本,例如语音输入法等。 人机交互 通过语音合成,实现高品质的机器人发声,使得人机交互更加自然。
适用语音客服质检、会议记录、语音短消息、有声读物、电话回访等场景。 在使用服务前,请先使用SIS体验中心体验服务功能。该方式无需编程,只需在网页端上传文字或音频,即可体验合成效果。 使用SIS体验中心前,请先注册华为账号并开通华为云。 图1 SIS体验中心
适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。 SDK概述 优先推荐使用新版SDK语音交互服务SDK,该SDK基于统一规范开发,支持Java/Python/C++/.NET/Go/NodeJs/PHP,使用方法可参考api-explorer。
适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。
实时语音识别连续模式 功能介绍 连续识别模式的语音总长度限制为五小时,适合于会议、演讲和直播等场景。 连续识别模式在流式识别的基础上,结合了语音的端点检测功能。
适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。 父主题: 产品咨询类
chinese_16k_court 支持采样率为16k的庭审会议语音识别。区域仅支持cn-north-4,不支持need_word_info参数。 chinese_16k_it 支持采样率为16k的IT会议语音识别。区域仅支持cn-north-4。
适用场景有语音客服质检、会议记录、语音短消息、有声读物、电话回访等。 调用API接口需要具备一定的编程开发能力,返回的结果为JSON格式,用户需要通过编程来处理识别结果。 您可以根据以下介绍选择合适的使用方式: 通过华为云EI智能体验馆,零基础,一键快速体验语音交互功能。
适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。 语音交互(实时语音识别、一句话识别、录音文件识别、语音合成)服务所提供的API为自研API。
chinese_16k_conversation 支持采样率为16k的会议场景的中文普通话语音识别。 请求参数 表6 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 用于获取操作API的权限。
对于16k单声道音频,支持多个说话人,取值范围是(speaker1 ~ speaker10),最多支持10个说话人,可用于会议场景。 emotion 否 String 情绪类型,目前仅支持NORMAL(正常),ANGRY(愤怒),UNKNOWN(未知)。
chinese_16k_conversation 支持采样率为16k的会议场景的中文普通话语音识别。 响应参数 响应类为FlashLasrResponse, 详见表6。调用失败处理方法请参见错误码。
chinese_16k_conversation 支持采样率为16k的会议场景的中文普通话语音识别。 响应参数 响应类为FlashLasrResponse, 详见表6。调用失败处理方法请参见错误码。
data_url 是 String 存放录音文件地址: 推荐使用华为云OBS:授权配置请参见配置OBS服务。 您也可以把录音文件放在自行搭建服务器上,提供下载文件的地址。URL不能使用IP地址,只能使用域名,请尽量避免中文。
CPP SDK(Windows) 使用实时语音识别 使用实时语音合成
Android SDK 一句话识别(http版) 一句话识别(websocket版) 实时语音识别连续模式 语音合成(http版) 语音合成(webSocket版)
CPP SDK(Linux) 使用实时语音识别 使用实时语音合成
区域与可用区 什么是区域与可用区 语音交互服务的区域如何选择
错误码类 SIS.0304报错 SIS.0103报错 SIS.0032报错 SIS.0535报错 APIG.0101报错 APIG.0201报错 APIG.0301报错 账密报错“The username or password is wrong.” Token与Project ID
产品咨询类 什么是语音交互服务 支持哪些语言 语音合成后输出的音频格式是什么 是否支持离线使用 语音合成后能否返回播放时长 是否支持aac格式的语音文件转文字 如何查看当前接口是否免费调用