检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
方言和英语仅支持“华北-北京四”区域。 端点检测参数(vad_head、vad_tail、max_seconds)会影响句子的分段结果,存在一定误差。对连续模式和单句模式生效,对流式一句话模式无效。 父主题: 约束与限制
成接口等。用户通过调用语音识别类接口,将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本,同时也支持通过调用语音合成接口将文本转换成逼真的语音等。适用场景有语音客服质检、会议记录、语音短消息、有声读物、电话回访等。 调用API接口需要具备一定的编程开发能力,返回的结果
Boolean 是否保存为本地音频。 saved_path 否 String 保存音频的本地路径,只有在请求时saved参数设置为true才生效。 表5 Result 参数名称 是否必选 参数类型 说明 data 是 String 合成后生成的语音数据,以Base64编码格式返回。
(data) => { if (data instanceof Buffer) { // 将Buffer转换为UTF-8编码的字符串 const messageString = data.toString('utf8');
为MONO,那么原始文件需要为单声道文件。 如果为双声道文件,系统会将其转换成单声道文件,可能会影响识别效果。 如果 channel 为 LEFT_AGENT或RIGHT_AGENT, 则原始文件需要为双声道文件,如果为单声道文件,系统会将其转换成双声道文件,识别结果会出现两条内容完全一致的文本。 当channel
(data) => { if (data instanceof Buffer) { // 将Buffer转换为UTF-8编码的字符串 const messageString = data.toString('utf8');
(data) => { if (data instanceof Buffer) { // 将Buffer转换为UTF-8编码的字符串 const messageString = data.toString('utf8');
SIS.0702 输入参数不合法。 例如,评测语言/评测模式不支持;音频/视频格式不支持;试题文本无效等情况。 请参考错误信息和API资料,更换正确的输入参数。 SIS.30003 下载OBS上的音频失败。 请检查OBS上音频是否可访问。权限配置方法请参见配置OBS访问权限。 SIS
private String path = ""; // 本地音频路径,如D:/test.wav, 也可将音频文件、音频流转换为byte数组后进行传送。 private String audioFormat = ""; // 音频格式,如pcm16k16bit
setChannel("MONO"); // 设置是否需要分析,默认为false。当前仅支持8k采样率音频。当其设置为true时,话者分离、情绪检测,速度、声道才生效。 request.setNeedAnalysis(true); // 设置是否需要话者分离,若是,则识别结果包含role,默认true