语音交互服务 SIS-一句话识别Http接口:代码示例

时间:2025-02-12 14:57:49

代码示例

如下示例仅供参考,最新代码请前往SDK(websocket)章节获取并运行。

# -*- coding: utf-8 -*-from huaweicloud_sis.client.asr_client import AsrCustomizationClientfrom huaweicloud_sis.bean.asr_request import AsrCustomShortRequestfrom huaweicloud_sis.exception.exceptions import ClientExceptionfrom huaweicloud_sis.exception.exceptions import ServerExceptionfrom huaweicloud_sis.utils import io_utilsfrom huaweicloud_sis.bean.sis_config import SisConfigimport jsonimport os# 鉴权参数# 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全; # 本示例以ak和sk保存在环境变量中来实现身份验证为例,运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SIS_AK/HUAWEICLOUD_SIS_SK。ak = os.getenv("HUAWEICLOUD_SIS_AK")             # 从环境变量获取ak 参考https://support.huaweicloud.com/sdkreference-sis/sis_05_0003.htmlassert ak is not None, "Please add ak in your develop environment"sk = os.getenv("HUAWEICLOUD_SIS_SK")             # 从环境变量获取sk 参考https://support.huaweicloud.com/sdkreference-sis/sis_05_0003.htmlassert sk is not None, "Please add sk in your develop environment"project_id = ""     # project id 同region一一对应,参考https://support.huaweicloud.com/api-sis/sis_03_0008.htmlregion = ''         # region,如cn-north-4"""    todo 请正确填写音频格式和模型属性字符串    1. 音频格式一定要相匹配。         例如wav音频,格式是wav。具体参考api文档。         例如音频是pcm格式,并且采样率为8k,则格式填写pcm8k16bit。         如果返回audio_format is invalid 说明该文件格式不支持。具体支持哪些音频格式,需要参考一些api文档。    2. 音频采样率要与属性字符串的采样率要匹配。         例如格式选择pcm16k16bit,属性字符串却选择chinese_8k_common, 则会返回'audio_format' is not match model         例如wav本身是16k采样率,属性选择chinese_8k_common, 同样会返回'audio_format' is not match model"""#  一句话识别 参数,以音频文件的base64编码传入,1min以内音频path = ''                               # 文件位置, 需要具体到文件,如D:/test.wavpath_audio_format = ''                  # 音频格式,如wav等,详见api文档path_property = 'chinese_16k_general'   # language_sampleRate_domain, 如chinese_16k_general,详见api文档def sasr_example():    """ 一句话识别示例 """    # step1 初始化客户端    config = SisConfig()    config.set_connect_timeout(10)  # 设置连接超时    config.set_read_timeout(10)  # 设置读取超时    # 设置代理,使用代理前一定要确保代理可用。 代理格式可为[host, port] 或 [host, port, username, password]    # config.set_proxy(proxy)    asr_client = AsrCustomizationClient(ak, sk, region, project_id, sis_config=config)    # step2 构造请求    data = io_utils.encode_file(path)    asr_request = AsrCustomShortRequest(path_audio_format, path_property, data)    # 所有参数均可不设置,使用默认值    # 设置是否添加标点,yes or no,默认no    asr_request.set_add_punc('yes')    # 设置是否将语音中数字转写为阿拉伯数字,yes or no,默认yes    asr_request.set_digit_norm('yes')    # 设置是否添加热词表id,没有则不填    # asr_request.set_vocabulary_id(None)    # 设置是否需要word_info,yes or no, 默认no    asr_request.set_need_word_info('no')    # step3 发送请求,返回结果,返回结果为json格式    result = asr_client.get_short_response(asr_request)    # use enterprise_project_Id    # headers = {'Enterprise-Project-Id': 'your enterprise project id', 'Content-Type': 'application/json'}    # result = asr_client.get_short_response(asr_request, headers)    print(json.dumps(result, indent=2, ensure_ascii=False))if __name__ == '__main__':    try:        sasr_example()    except ClientException as e:        print(e)    except ServerException as e:        print(e)
support.huaweicloud.com/sdkreference-sis/sis_05_0051.html