检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。 父主题: 产品咨询类
chinese_16k_conversation 支持采样率为16k的会议场景的中文普通话语音识别。 响应参数 响应类为FlashLasrResponse, 详见表6。调用失败处理方法请参见错误码。
chinese_16k_conversation 支持采样率为16k的会议场景的中文普通话语音识别。 响应参数 响应类为FlashLasrResponse, 详见表6。调用失败处理方法请参见错误码。
实时语音识别连续模式 功能介绍 连续识别模式的语音总长度限制为五小时,适合于会议、演讲和直播等场景。 连续识别模式在流式识别的基础上,结合了语音的端点检测功能。
适用语音客服质检、会议记录、语音短消息、有声读物、电话回访等场景。 在使用服务前,请先使用SIS体验中心体验服务功能。该方式无需编程,只需在网页端上传文字或音频,即可体验合成效果。 使用SIS体验中心前,请先注册华为账号并开通华为云。 图1 SIS体验中心
适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。
会议实时记录 将视频或电话会议中的音频实时转为文字,可实时校核、修改及检索转写会议内容,提高会议效率。 即时文本录入 手机App上实时录音并即时提供转写的文本,例如语音输入法等。 人机交互 通过语音合成,实现高品质的机器人发声,使得人机交互更加自然。
音频需要上传华为云OBS,提供华为云OBS对象地址,能快速返回识别结果。该接口的使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。
data_url 是 String 存放录音文件地址: 推荐使用华为云OBS:授权配置请参见配置OBS服务。 您也可以把录音文件放在自行搭建服务器上,提供下载文件的地址。URL不能使用IP地址,只能使用域名,请尽量避免中文。
实时语音合成响应 开始合成响应 语音合成结果响应 语音合成结束响应 语音合成错误响应 严重错误响应 父主题: 实时语音合成接口
适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。 SDK概述 优先推荐使用新版SDK语音交互服务SDK,该SDK基于统一规范开发,支持Java/Python/C++/.NET/Go/NodeJs/PHP,使用方法可参考api-explorer。
计费类 套餐包购买后是否支持退款 服务当前处于商用还是免费阶段 如何收费 如何续费 查看套餐用量明细、账单明细 账号中存在语音合成服务的套餐,但是为什么却收到了欠费的信息 欠费后充值账户,为什么调用SIS API仍返回'resource type is RESTRICTED' 欠费后套餐包能否继续使用
适用场景有语音客服质检、会议记录、语音短消息、有声读物、电话回访等。 调用API接口需要具备一定的编程开发能力,返回的结果为JSON格式,用户需要通过编程来处理识别结果。 您可以根据以下介绍选择合适的使用方式: 通过华为云EI智能体验馆,零基础,一键快速体验语音交互功能。
录音文件识别接口 提交录音文件识别任务 获取录音文件识别结果
请确认近期华为云账号是否有升级为华为账号。当前,如果您通过华为账号入口登录华为云账号,就会指引升级。华为云账号若已升级为华为账号,将不支持获取账号Token。 建议您创建一个IAM账户,使用该账户获取Token。
chinese_16k_court 支持采样率为16k的庭审会议语音识别。区域仅支持cn-north-4,不支持need_word_info参数。 chinese_16k_it 支持采样率为16k的IT会议语音识别。区域仅支持cn-north-4。
语音合成接口 语音合成 SSML标记语言介绍
对于16k单声道音频,支持多个说话人,取值范围是(speaker1 ~ speaker10),最多支持10个说话人,可用于会议场景。 emotion 否 String 情绪类型,目前仅支持NORMAL(正常),ANGRY(愤怒),UNKNOWN(未知)。
适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。 语音交互(实时语音识别、一句话识别、录音文件识别、语音合成)服务所提供的API为自研API。
约束与限制 实时语音识别 一句话识别 录音文件识别 语音合成 录音文件识别极速版