检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
job_id String 照片建模任务ID。 state String 任务的状态。 WAITING:等待任务调度 PROCESSING:正在处理 PARTIAL_SUCCEED:部分成功(模型生成,截图失败) SUCCEED:成功 FAILED:失败 CANCELED:取消 start_time
话框。 图7 导入训练语料 单击“下载模板”,将语料模板下载至本地。 请按照模板文件的格式,填充完成所有问题分类及其全量语料对,保存文件。 单击“添加文件”,从本地选择文件,单击“确定”。 等待文件导入成功后,可以看到增加成功的问题类别及其全量语料对,示例如图8所示。 图8 批量导入语料
String 参数解释: 音色资产ID,可以从资产库中查询。 音色ID的查询操作,详见查询预置音色ID。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 speed Integer 参数解释: 语速。50表示0.5倍语速,100表示正常语速,200表示2倍语速。
需整段录制所有语料生成一个长音频WAV或MP3格式文件,每句之间有2~3秒的停顿。WAV或MP3格式文件可直接上传MetaStudio控制台,无需压缩,无需提供语料txt文件。 推荐使用服务预置语料,也可自定义语料。系统会自动根据停顿做切割,自动识别文本内容。 音频文件命名无要求,可自定义,命名示例:Voice
asset_id 否 String 资产ID。 asset_info 否 String 加密后的资产信息。 encryption_info 否 ReplicationEncInfo object 加密信息 expire_time 否 Long 过期时间 取值范围: 0-9223372036854775807
一次性计费 声音制作 按声音制作的个数计费。 包括如下类型: 基础版:20条语料音频 进阶版:100条语料音频 高级版:1小时以上的长音频WAV文件 每成功制作1个声音,从所购预付费资源包中扣除1个。 一次性计费 分身数字人视频直播 按数字人各路直播的总时长计费。 包年/包月有效期内,自动走包年/包月套餐。
第三方用户ID。不允许输入中文。 表3 FormData参数 参数 是否必选 参数类型 描述 file 是 File 照片文件。 说明: 只能上传jpg/jpeg/png格式文件, 最大分辨率为3840*2160 style_id 是 String 数字人风格ID。 system_male_001:男性风格01
String 输出数据的格式版本,如请求中无此参数,则输出数据格式为1.0,可选值有: 1.0: 对应的输出为: 动作数据:75个骨骼旋转值 表情数据:52ARkit表情及参数 2.0: 对应的输出为: 动作数据:55个骨骼旋转值+骨骼3D坐标 表情数据:178个控制器的数据 响应参数 状态码:
eplication-info 复制资产 文件管理 表2 文件管理接口 接口 说明 DELETE /v1/{project_id}/files/{file_id} 删除文件 POST /v1/{project_id}/files 创建文件并获取上传URL POST /v1/{pr
租户级自定义读法配置、修改TTS租户级自定义读法配置。 2024-12-05 第十三次正式发布 本次变更如下: 新增接口组:分身数字人字幕文件生成管理。 新增接口组:第三方直播平台管理。 2024-11-30 第十二次正式发布 本次变更如下: 语音合成管理接口组,新增接口:创建TTS异步任务、获取TTS异步任务。
StyleAssetItem objects 风格化素材资产组合。 extra_meta StyleExtraMeta object 数字人风格额外元数据信息 style_id String 数字人风格ID create_time String 数字人风格创建时间,格式遵循:RFC 3339。