检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
默认取值: true edit_enable Boolean 是否支持模型编辑 默认取值: true edit_engine String 编辑使用引擎 model_id String 照片建模算法调用的模型类型 状态码: 400 表9 响应Body参数 参数 参数类型 描述 error_code
参数类型 描述 picture_url 是 String 图片URL style_id 是 String 风格ID name 是 String 模型名称 notify_url 否 String 照片建模任务结束的回调地址。 响应参数 状态码: 200 表4 响应Header参数 参数 参数类型
所有语料录制生成一个长音频WAV或MP3文件,命名示例:Voice.wav。 音频导出 操作如下所示: 打开超级录音机软件,进入音频文件列表页面。 通过长按音频文件的方式,选中所有文件,单击分享图标,可选择隔空投送或其他第三方应用导出音频文件至PC中。 一个长音频文件无需压缩,可直接上传至MetaStudio控制台,进行声音训练。
操作前提 注册操作 注册华为账号:单击进入注册页面。 完成实名认证:单击进入实名认证。 账户充值:为确保正常使用MetaStudio,您需要进行账户充值。 开通MetaStudio服务:单击进入MetaStudio控制台,根据开通引导完成服务开通。 推荐浏览器 推荐使用Chrom
37118098b CertUtil: -hashfile 命令成功完成。 参考表1,下载SDK安装包完整性校验文件至本地。 使用文本编辑器打开完整性校验文件,查看文件中的SHA256值和2中生成的SHA256值是否一致。 如果一致,说明SDK安装包下载过程中,不存在篡改和丢包现象。
视频直播 直播剧本保存失败怎么办? 提示模板不可用怎么办? 直播业务媒体流如何应对防火墙限制? 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 第三方平台的直播画面没有声音怎么办?
超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。
第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 voice_asset_id 是 String 音色模型ID。需要使用MetaStudio的数字资产管理相关接口从资产库查出。 script_type 否 String 脚本类型,即视频制作的驱动方式。默认TEXT
文本驱动方式的要求如下所示: 文本输入长度不超过2000字。 通过文本合成的音频时长不能超过5分钟。 在照片数字人制作页面,选择“文本驱动”方式驱动照片说话时,需要输入文本并选择音色,再单击“试听”预估音频时长。如果超过5分钟,会导致照片数字人制作失败。 父主题: 使用限制
资产管理 数字资产管理 文件管理
关联租户 SP用户可以将购买的资源分配给多个租户使用。分配资源前,需先参考本节,关联所有租户。 前提条件 关联租户已注册华为账号:单击进入注册页面。 关联租户已完成实名认证:单击进入实名认证。 关联租户提供项目ID给SP用户,获取项目ID的方法请参见获取项目ID。 关联租户提供的
支持多选,支持添加新类别。 产品素材 合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作: 单击商品
分身视频制作 视频制作剧本管理 数字人视频制作管理 分身数字人视频制作管理 数字人名片制作管理 照片数字人视频制作管理 分身数字人字幕文件生成管理
超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。
RESIZE codec 是 String 参数解释: 视频编码格式及视频文件格式。 约束限制: 仅分身数字人视频制作支持VP8编码。 取值范围: H264:h264编码,输出mp4文件。 VP8:vp8编码,输出webm文件。 默认取值: 不涉及 bitrate 是 Integer 参数解释:
核通过),AUDIT_NOT_PASS(审核未通过),TRAINING_FINISH(训练完成),UPLOADING_MODEL(上传语音模型),COMPLETE_JOB(任务完成) operator String 操作者,USER(用户),ADMIN(管理员),SYSTEM(用户)
语音合成管理 创建TTS试听任务 获取TTS试听文件 创建TTS异步任务 获取TTS异步任务 设置TTS租户级自定义读法配置 获取TTS租户级自定义读法配置 删除TTS租户级自定义读法配置 修改TTS租户级自定义读法配置 语音同步合成WebSocket接口
Command命令说明 直播控制RTSA Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值 预置音色ID列表 查询音色ID
error_code String 业务返回码 MSS.000000001 - 失败 MSS.000000002 - 内部错误 MSS.000000003 - 非法参数 MSS.000000004 - 非法访问,未鉴权或者鉴权失败 error_msg String 返回描述 request_id
创建进阶版语音训练任务 创建高级版语音训练任务 查询语音训练任务列表 提交语音训练任务 查询语音训练任务详情 删除语音训练任务 查询任务操作日志 获取语音文件上传地址 获取语音训练任务审核结果 设置任务批次 确认在线录音结果 获取在线录音确认结果