检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 text 是 String 待合成文本 tts_text 否 String 发送给tts的待合成文本 voice_asset_id 是 String 音色ID,获取方式详见获取音色ID。 speed 否 Integer
introduction_type String 自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动,需要在资产库中先上传语音资产 默认取值: TEXT introduction_text String 自我介绍文本,用于驱动数字人口型。 voice_asset_id String
我们现在的最新版本是12.4,左上角的帮助-检查更新自查一下自己的版本,如果无法直接更新的,可以直接到咱们的官网重新下载更新。 认识完界面,接下来聊聊AI文本创作的功能,文本创作功能主要可以帮助我们快速输出文案。 比如,我想快速了解最近一部上映的电影的剪辑风格。 我就会问他,《这个杀手不太冷》的电影解说
String 批次名称 output_language 否 String 模型输出语言类型 custom_text 否 String 自定义试听文本 响应参数 状态码:200 表4 响应Body参数 参数 参数类型 描述 job_id String 任务id。 training_data_uploading_url
第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 text 是 String 待合成文本。 tts_text 否 String 发送给tts的待合成文本。 emotion 是 String 音色ID,获取方式详见获取音色ID。 speed 否 Integer
下智能交互SDK的任一参数。 须知: 进行智能交互时,透明背景支持的浏览器及版本,详见客户端SDK参考-快速入门-表3。 设置create接口参数config内的配置参数useDefaultBackground,其默认值为true,需修改为false。 代码示例,如下所示: HwICSUiSdk
查询分身数字人模型训练任务详情 功能介绍 该接口用于查询分身数字人模型训练任务详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-training-manage/user/jobs/{job_id} 表1 路径参数
发送API请求。 “APIGW”开头的错误码列表,详见错误码说明。 表1 API流控限制 接口分类 接口名称 单租户接口流控 (华北-北京四) 单租户接口流控 (华东-上海一) 单租户接口流控 (亚太-新加坡) 数字资产管理 创建资产 10次/秒 5次/秒 5次/秒 查询资产列表
创建声音制作任务(自研模型) MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用自研模型自定义生成声音。 操作限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书
文件上传地址,有效期为24小时。 说明: 调用OBS的“PUT上传”接口上传文件。 调用上述接口时,Content-MD5头必须填写,填写的值跟file_md5中的值相同,md5值获取详情请参考使用Java代码生成文件内容的MD5值。 调用上述接口时,Content-Type头必须填写,填写的值根据不同的文件类型有所不同。
Flexus支持通过API集成使用吗? 支持,详见接口创建分身数字人模型训练任务的is_flexus字段。 父主题: API和SDK使用
声音制作 MetaStudio支持自定义生成声音。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 参考真人声音录制,提前录制一个WAV或MP3格式的长音频文件,每句之间需要有2~3秒的停顿。语料推荐使用文案样例(基础版)。 声音授权签署文件。 操作步骤 登录MetaStudio控制台。
查看租户资源用量信息 功能介绍 查询租户一次性和包周期(包年/包月)资源用量信息。 按需套餐包用量本接口无法查询,需要调用CBC接口查询。按需套餐包用量查询和查询资源包信息。 各种资源的计费方式请参考计费说明。 调用方法 请参见如何调用API。 URI GET /v1/{proj
购买出门问问声音套餐 购买出门问问声音套餐, 详见购买出门问问语音合成套餐的操作流程。 购买出门问问语音合成套餐的操作流程 如需使用系统预置的第三方声音,需要购买出门问问语音合成套餐包,详细的操作流程如下所示。第三方声音支持的语言类型,如第三方声音支持的语言类型所示。 购买出门问
其中,“digital-assets”也是接口查询资产列表URI中的值。 在右侧界面的“Preview”页签中,可以看到所有音色的“asset_id”,即要查询的音色ID。 图2 查询音色ID 使用接口查询音色ID(方式三) 支持使用查询资产列表接口,查询音色ID。需要设置如下参数:
表14 TextLayerConfig 参数 是否必选 参数类型 描述 text_context 否 String 参数解释: 文字图层的文本,内容需做Base64编码。 示例:若想添加文字水印“测试文字水印”,那么text_context的值为:5rWL6K+V5paH5a2X5rC05Y2w
String 第三方用户id output_language 否 String 模型输出语言类型 custom_text 否 String 自定义试听文本 响应参数 状态码:400 表4 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg
PLAY_READY:形象模型加载完成的状态。此时数字人处于静默状态,等待开始播放剧本的指令。 PROCESSING:数字人的工作状态。数字人会根据直播任务中预置的文本或音频进行直播。 PLAY_PAUSE:数字人直播暂停状态。此时数字人会处于静默状态,等待恢复剧本播放的指令。 TAKE_OVER:真人接
设置TTS租户级自定义读法配置 功能介绍 该接口用于设置TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsc/vocabulary-configs 表1 路径参数 参数 是否必选 参数类型 描述 project_id
创建技能 技能是一组智能问答对的组合,详细操作如下所示: 在MetaStudio控制台创建技能并导出技能文件:先创建技能,再添加所有问答对后,导出技能文件。 在科大讯飞创建同名技能并导入技能文件:将MetaStudio导出的技能文件导入至科大讯飞的同名技能中。 创建智能交互数字人