检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
SDK在本地进行开发。 该SDK可以将用户输入的文字合成为音频。通过音色选择,自定义音量、语速,实现个性化音频的生成。 前提条件 注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费、冻结、被注销等异常状态。 操作步骤 获取SIS Python SDK。 获取并下载SIS Python
可以更加准确、具体的定义合成音频的效果,包括控制断句分词方式、发音、速度、停顿、声调和音量等特征。相比文本输入进行合成,有更好的操作灵活性。 华为云语音合成服务的SSML实现,基于W3C的语音合成标记语言版本1.1,但并不支持W3C包含的所有的标记类型。目前仅华小飞,华小美,华小龙,华小蕊合成支持
华东-上海一,推荐的区域。 支持wav、mp3、m4a、acc、opus格式音频文件。 语音时长不超过120分钟,文件大小不超过100M。 支持从华为云对象存储服务(OBS)下载音频,需要用户提供OBS桶名和对象键值。 父主题: 约束与限制
AK/SK认证 使用服务API需要进行认证,目前SDK仅支持AK/SK认证方式。 使用AK/SK方式,需要用户提供AK和SK。 注册并登录华为云管理控制台。 在控制台中,鼠标移动至右上角的用户名处,在下拉列表中单击“我的凭证”。 单击“访问密钥”页签,在页签中,单击“新增访问密钥”。
权限的用户组和用户,多个企业项目之间相互独立,资源分开结算。 企业账号可申请开通企业项目。账号需要进行企业实名认证。如果企业账号注册成为华为云合作伙伴,将无法进入企业项目管理页面。 开通企业项目后,企业项目内的用户在调用SIS API时,只有在请求Header参数中传入Enter
创建企业项目的用户必须是管理员,或在IAM侧已被授予EPS FullAccess权限的用户。 企业账号可申请开通企业项目。账号需要进行企业实名认证。如果企业账号注册成为华为云合作伙伴,将无法进入企业项目管理页面。 图1 操作流程 创建企业项目 登录控制台,单击界面右上方的“企业 > 项目管理”。 屏幕分辨率低的情况下单击页面右上方的“更多
中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 图1阐明了区域和可用区之间的关系。 图1 区域和可用区 目前,华为云已在全球多个地域开放云服务,您可以根据需求选择适合自己的区域和可用区。 如何选择区域? 选择区域时,您需要考虑以下几个因素: 地理位置 一
确保已按照配置Java环境配置完毕。 确保已存在待识别的音频文件并上传OBS或者有公网可访问服务器上(需保证可使用域名访问),示例音频可参考下载SDK压缩包文件。如果音频存放在OBS上,确保服务已授权访问OBS,可参考配置OBS服务。 请参考SDK(websocket)获取最新版本SDK包。
语音交互(实时语音识别、一句话识别、录音文件识别、语音合成)服务所提供的API为自研API。 表1 实时语音识别接口说明 接口类型 说明 实时语音识别接口 华为云提供的Websocket接口,主要用于实时语音识别。音频分片传输,服务器端可以返回中间临时转写结果,在最后返回最终转写结果。 表2 一句话识别接口说明
PS请求返回一个 4xx 或 5xx 的 HTTPS状态码。返回的消息体中是具体的错误代码及错误信息。在调用方找不到错误原因时,可以联系华为云客服,并提供错误码,以便尽快帮您解决问题。 错误响应Body体格式说明 当接口调用出错时,会返回错误码及错误信息说明,错误响应的Body体格式如下所示。
config.withIgnoreSSLVerification(true); 配置认证信息。 配置AK、SK、project_id信息。华为云通过AK识别用户的身份,通过SK对请求数据进行签名验证,用于确保请求的机密性、完整性和请求者身份的正确性。 使用永久AK和SK BasicCredentials
普通发音人property取值范围 property取值 说明 chinese_xiaoqi_common 小琪,标准女声发音人。 chinese_xiaoyu_common 小宇,标准男声发音人。 chinese_xiaoyan_common 小燕,温柔女声发音人。 chinese_xiaowang_common
config.withIgnoreSSLVerification(true); 配置认证信息。 配置AK、SK、project_id信息。华为云通过AK识别用户的身份,通过SK对请求数据进行签名验证,用于确保请求的机密性、完整性和请求者身份的正确性。 使用永久AK和SK BasicCredentials
SDK调用一句话识别服务的样例,帮助用户快速了解如何使用Java SDK调用华为云SIS服务。具体操作如下所示: 步骤1:配置环境 步骤2:修改配置信息 步骤3:调用一句话识别 准备工作 注册华为帐号并开通华为云,并完成实名认证,帐号不能处于欠费或冻结状态。 操作须知 语音交互服务的
支持采样率(Hz) 支持audio_format 小琪 chinese_xiaoqi_common 标准女声 客服 8k/16k pcm、alaw、ulaw 小宇 chinese_xiaoyu_common 标准男声 电销 8k/16k pcm、alaw、ulaw 小燕 chinese_xiaoyan_common
若欠费前未调用对应接口,如一句话识别,则默认未开通该接口,欠费后将不可调用,无论是否有套餐包剩余。若欠费前已调用对应接口,则默认开通该接口,欠费后可继续使用至账户被华为云账户中心冻结为止。冻结由账户中心控制,一般情况下套餐包未使用完不会被冻结。 不可重置且不是续期购买套餐包方式的API接口,例如“一句话识别
电话回访 在客服系统场景中,通过将回访内容转换成人声,直接使用语音和客户交流,提升用户体验。 智能教育 集成语音合成的教育系统可以实现中文标准朗读及带读,应用于课堂和学生自学,提升教学效率。 直播实时字幕 将视频直播或现场直播中的音频实时转为字幕,为观众提供更高效的观会体验,方便对直播内容进行监控。
AsrCustomLongRequest 参数名称 是否必选 参数类型 描述 data_url 是 String 存放录音文件地址: 推荐使用华为云OBS:授权配置请参见OBS配置。 您也可以把录音文件放在自行搭建服务器上,提供下载文件的地址。URL不能使用IP地址,只能使用域名,请尽量避免中文
支持采样率(Hz) 小琪 chinese_xiaoqi_common 标准女声 客服 8k/16k 小雯 chinese_xiaowen_common 柔美女声 客服 8k/16k 小宇 chinese_xiaoyu_common 标准男声 电销 8k/16k 小夏 chinese_xiaoxia_common
Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/asr/transcriber/jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 job_id 是 String 录音文件识别任务标识符。 project_id