检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建热词时,需要保证name在此之前没有被创建使用过。如 test1 word_list = list() # 用于存放热词表。每个热词表最多可以存放10000个热词。如["计算机", "网络"] vocabulary_id = '' # 用于更新指定热词表id信息,查询指定热词表id信息,删除指定热词表id信息
AsrCustomLongRequest 参数名称 是否必选 参数类型 描述 data_url 是 String 存放录音文件地址: 推荐使用华为云OBS:授权配置请参见OBS配置。 您也可以把录音文件放在自行搭建服务器上,提供下载文件的地址。URL不能使用IP地址,只能使用域名,请尽量避免中文
// 1.4 config request parameter std::string text = AnsiToUtf8("华为致力于把数字世界带入每个人每个家庭每个组织,构建万物互联的智能世界。"); RttsRequest request(text); request
html DEFINE_string(projectId, "", "project id"); DEFINE_string(text, "华为致力于把数字世界带入每个人每个家庭每个组织,构建万物互联的智能世界。", "Text to be synthesized"); DEFIN
6kb,16k采样率音频最小为3.2kb,即音频时长至少0.1s以上。 需要将识别的录音文件存放在某服务上,可以通过URL访问。 推荐使用华为云OBS:授权配置请参见配置OBS服务,优先推荐使用与请求服务同一region的私有桶文件,如果region不一致,可考虑使用obs签名。
hort-stream 实时流一句话模式 void sentenceStreamConnect(RasrRequest request) wss://{endpoint}/v1/{project_id}/rasr/sentence-stream 实时流单句模式 AsrCustomizationClient
在1.x版本以后,新增了onclose接口的入参,导致和之前旧版本不兼容。sdk1.7.1版本已解决该兼容性问题,旧版本sdk如果在使用实时流遇到onclose参数报错,可考虑更新sdk解决问题。 父主题: 准备环境
AsrCustomLongRequest 参数名称 是否必选 参数类型 描述 dataUrl 是 String 存放录音文件地址: 推荐使用华为云OBS:授权配置请参见OBS配置。 您也可以把录音文件放在自行搭建服务器上,提供下载文件的地址。URL不能使用IP地址,只能使用域名,请尽量避免中文。
0字按一次计;普通发音人每100字计一次调用,不足100字按一次计。其中1个汉字、1个英文字母或1个标点均算作1个字符,具体费用请参考价格计算器。 普通发音人:取值范围请参考表 普通发音人property取值范围。 精品发音人:区域仅支持cn-north-4、cn-east-3,暂时不支持音高调节,取值范围请参考表
可阅读性。 中英文混合识别 支持在中文句子识别中夹带英文字母、数字等,从而实现中、英文以及数字的混合识别。 即时输出识别结果 连续识别语音流内容,即时输出结果,并可根据上下文语言模型自动校正。 自动静音检测 对输入语音流进行静音检测,识别效率和准确率更高。 产品优势 识别准确率高
onTranscriptionResponse(byte[] bytes) { Log.i("info", "合成过程中返回的二进制流"); audioTrackService.setAudioData(bytes); } }; @Override protected
region,如cn-north-4 # 一句话识别参数 path = '' # 需要发送音频路径,如D:/test.pcm, 同时sdk也支持byte流发送数据。 audio_format = '' # 音频支持格式,如pcm16k16bit,详见api文档 property = ''
sasrWebsocketClient.sendAudio(path, byteLen, sleepTime); // 可直接发送byte流,即byte数组 // byte[] data = IOUtils.getFileData(path); // sasrWebsocketClient
model """ # 实时语音识别参数 path = '' # 需要发送音频路径,如D:/test.pcm, 同时sdk也支持byte流发送数据。 audio_format = 'pcm16k16bit' # 音频支持格式,如pcm16k16bit,详见api文档 property
sendAudio(path, 3200, 200); // rasrClient.sendAudio(path); // 可直接发送byte流,即byte数组 // byte[] data = IOUtils.getFileData(path); // rasrClient