检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
多语言的计费规则? 文本转语音是以字数来计费的,多语言不是计费项,无需另外付费。 自研声音目前只有中英文,声音合成按需计费标准为:¥200.00/百万字,可以在MetaStudio服务概览页面的“声音合成”卡片中查看,如图1所示。 图1 声音合成计费项 第三方声音的计费标准,详见云商店语音合成商品页面的价格表。
描述 rule_index 否 String 参数解释: 规则索引。用于触发规则时索引具体规则。 约束限制: 无需用户填写。 取值范围: 字符0-64位 默认取值: 不涉及。 rule_name 否 String 参数解释: 规则名称。 约束限制: 不涉及。 取值范围: 字符0-256位
第三方语言模型地址 MetaStudio服务调用第三方语言模型的API地址。 MetaStudio服务对接第三方语言模型LLM时,需要按照MetaStudio服务定义的接口参数格式开发LLM接口,详见智能交互第三方LLM回调接口。然后由MetaStudio服务调用此接口,实现智能交互能力。
描述 rule_index 否 String 参数解释: 规则索引。用于触发规则时索引具体规则。 约束限制: 无需用户填写。 取值范围: 字符0-64位 默认取值: 不涉及。 rule_name 否 String 参数解释: 规则名称。 约束限制: 不涉及。 取值范围: 字符0-256位
参数类型 描述 rule_index String 参数解释: 规则索引。用于触发规则时索引具体规则。 约束限制: 无需用户填写。 取值范围: 字符0-64位 默认取值: 不涉及。 rule_name String 参数解释: 规则名称。 约束限制: 不涉及。 取值范围: 字符0-256位
设置TTS租户级自定义读法配置 功能介绍 该接口用于设置TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsc/vocabulary-configs 表1 路径参数 参数 是否必选 参数类型 描述 project_id
需排查是否是OBS工具设置的桌面音频设备与Windows系统的声音输出设备不一致导致。 检查方法如下所示: 检查OBS桌面音频设备 检查Windows系统的声音输出设备 检查OBS桌面音频设备 本地打开OBS视频采集工具。 在界面下方,选择“混音器”。 图1 OBS工具 单击“桌
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
电脑是否有独立显卡。 OBS视频采集工具的基础分辨率配置是否与输出分辨率一致。 检查独立显卡 用户使用的第三方直播平台所在电脑,必须装有独立显卡。 检查OBS视频分辨率配置 OBS视频采集工具的基础分辨率和输出分辨率的值需要保持一致。 检查方法如下所示: 本地打开OBS视频采集工具。 在界面上方的导航栏中,选择“文件
登录MetaStudio控制台。 单击界面左上角的“服务概览”,进入MetaStudio服务概览页面。 在左侧导航栏中,选择“子账户隔离配置 > 账户设置”,进入“账户设置”页面,如图1所示。 图1 账户设置 参数配置说明,如表1所示。 表1 参数配置 区域 参数 说明 IAM用户设置 IAM子账户隔离能力 支持开启IAM子账号隔离能力。
设置任务批次 功能介绍 用户设置任务批次,该接口用于批量任务管理场景,设置任务的批次 需要开通NA租户权限后才能正常调用 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/voice-training-manage/user/batch 表1 路径参数
电脑是否有独立显卡。 OBS视频采集工具的基础分辨率配置是否与输出分辨率一致。 检查独立显卡 用户使用的第三方直播平台所在电脑,必须装有独立显卡。 检查OBS视频分辨率配置 OBS视频采集工具的基础分辨率和输出分辨率的值需要保持一致。 检查方法如下所示: 本地打开OBS视频采集工具。 在界面上方的导航栏中,选择“文件
用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0.wav~99.wav;文本文件命名规则:0.txt~99
用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0.wav~19.wav;文本文件命名规则:0.txt~19
用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。
3中可能错误,如下所示: Content-MD5设置错误,因为文件的MD5计算错误,且没有进行Base64编码。 Content-Type设置错误,格式设置的不对。 使用OBS的PUT上传接口上传资产文件时,没有以二进制流binary方式上传。 接口返回状态码400,是接口传参有问题,需要检查参数配置。
strings 音频上传的地址。 说明: 通过该obs地址上传时需要设置content-type为audio/wav txt_uploading_url Array of strings 文本上传的地址。 说明: 通过该obs地址上传时需要设置content-type为text/plain
API概览 华为云MetaStudio服务对应的接口列表如下所示,在调用API前,您需要先获取用户Token,Token可以用于调用其他API时鉴权,具体如何调用API请参考应用示例。 数字资产管理 表1 数字资产管理接口 接口 说明 POST /v1/{project_id}/digital-assets
用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。
of strings 音频上传的地址。 通过该obs地址上传时,需设置content-type为audio/wav txt_uploading_url Array of strings 文本上传的地址。 通过该obs地址上传时需设置content-type为text/plain 状态码:400