检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
SDK支持哪些语言 目前union sdk(仅支持https接口)已支持java、python、.net、cpp、go。websocket接口支持Java、Python,cpp,后续根据需求考虑支持其他语言。 父主题: SDK使用类
功能体验与试用 语音交互服务(Speech Interaction Service,SIS)支持语音识别、语音合成功能。适用语音客服质检、会议记录、语音短消息、有声读物、电话回访等场景。 在使用服务前,请先使用SIS体验中心体验服务功能。该方式无需编程,只需在网页端上传文字或音频,即可体验合成效果。
下载SDK包下载SDK使用,当前支持Java SDK、Python SDK、CPP SDK。后序章节均指代该SDK,使用方法可参考Java SDK、Python SDK、CPP SDK(Windows)、CPP SDK(Linux)。当前自研SDK仅java和python提供企业项目配置入口,在代码示例中配置,其他语言暂未支持。
话、粤语和上海话。 文本时间戳 为音频转换结果生成特定的时间戳,从而通过搜索文本即可快速找到对应的原始音频。 智能断句 通过提取上下文相关语义特征,并结合语音特征,智能划分断句及添加标点符号,提升输出文本的可阅读性。 中英文混合识别 支持在中文句子识别中夹带英文字母、数字等,从而实现中、英文以及数字的混合识别。
Storage Service(对象存储服务),提供海量、安全、高可靠、低成本的数据存储能力,可供用户存储任意类型和大小的数据。 EI企业智能服务对于图片、语音等多媒体文件支持直接使用华为云OBS服务的数据处理方式,以减少服务使用成本,降低服务的响应时长,提升服务使用的体验。语音
述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本,同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。 父主题: 产品咨询类
支持audio_format 华小美 chinese_huaxiaomei_common 温柔女声 客服 8k/16k pcm、mp3 华小飞 chinese_huaxiaofei_common 朝气男声 客服 8k/16k pcm、mp3 华小汝 chinese_huaxiaoru_common
语音合成的base64编码如何使用 问题现象 用户在使用语音合成获取响应体的base64编码,不了解应该如何进一步使用。 解决方案 1. 建议用户使用Java或Python SDK,可参考SDK简介。 2. 使用html网页播放,新建一个html文件,如下填写内容,即可在浏览器播放。 <audio
器。调用的详细操作请参考使用实时语音识别 。 登录华为云,单击右上角的“控制台”,进入“管理控制台”界面。 在左侧服务列表中选择“EI企业智能 > 语音交互服务”。 在语音交互服务主页,单击左侧导航栏子服务名称(如“一句话识别”)进入管理控制台。 单击“申请公测”,进行服务公测申请。
lasr_demo() 使用Java语言提交录音文件识别任务 import java.io.BufferedReader; import java.io.InputStream; import java.io.InputStreamReader; import java.io.OutputStreamWriter;
式”三种模式。 三种模式的握手请求wss-URI不同,基于Websocket承载的实时语音识别请求和响应的消息格式相同。 开发者可以使用java、python、c++等开发语言支持Websocket的对应软件包或库接口,与实时语音识别引擎握手连接,并发送语音数据和接收转写结果,最后关闭Websocket连接。
Integer 设置音量,0~100,默认50。 SetSpeed 否 Integer 设置语速,-500~500,默认0。 示例代码 如下示例仅供参考,最新代码请前往SDK(websocket)章节获取并运行。 #include "IoUtil.h" #include "RttsClient
sleep(10) ws.close() if __name__ == '__main__': rasr_demo() Java语言请求代码示例 import okhttp3.OkHttpClient; import okhttp3.Request; import okhttp3
设置语速,-500~500,默认0。 SetSubtitle 否 String 设置字幕,部分发音人支持字幕时间戳,详见API文档。 示例代码 如下示例仅供参考,最新代码请前往SDK(websocket)章节获取并运行。 #include "RttsClient.h" #include "RttsRequest
配置Android 环境 配置环境。 在使用语音交互SDK时,需要提前配置好android系统的开发环境,如表1所示。 表1 配置环境准备项 准备项 说明 JDK Java开发环境的基础配置。版本要求:推荐使用1.8版本。 Gradle 在Gradle官网上下载好之后,配置环境变量即可。推荐使用Gradle7
sasr_demo() 使用Java语言上传短音频,快速返回识别结果 import java.io.BufferedReader; import java.io.InputStream; import java.io.InputStreamReader; import java.io.OutputStreamWriter;
如何修改发音人 修改代码中property的取值即可,支持的发音人如表1和表2所示。 POST https://{endpoint}/v1/{project_id}/tts Request Header: Content-Type: application/json X-Auth-Token:
用简介章节。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI PUT /v1/{project_id}/asr/vocabularies/{vocabulary_id}
用简介章节。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/asr/vocabularies/{vocabulary_id}
用简介章节。 查询 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI DELETE /v1/{project_id}/asr/vocabularies/{vocabulary_id}