正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
删除文件 功能介绍 该接口用于删除媒体资产库中指定的文件。 调用方法 请参见如何调用API。
创建大文件 功能介绍 该接口用于创建大文件(超过5G),获取分段上传URL。 调用方法 请参见如何调用API。
确认文件已上传 功能介绍 资产文件上传完毕后,通过该接口确认上传完成。 调用方法 请参见如何调用API。
文件管理 创建文件并获取上传URL 删除文件 确认文件已上传 创建大文件 父主题: 资产管理
MAIN:主文件 COVER:封面文件 PAGE:PPT内容页图片文件 SAMPLE:样例音频或样例动作文件 OTHER:其他文件 WHOLE_MODEL:全模型文件(3D数字人) USER_MODIFIED_MODEL:用户上传模型(3D数字人) 说明: 资产类型为SCENE、ANIMATION
获取TTS试听文件 功能介绍 该接口用于获取TTS试听文件下载链接,返回List中包含当前已生产的试听文件。 调用方法 请参见如何调用API。
PPT转PDF的操作方法,如下所示: 本地打开PPT文件,在左上方的导航栏中,选择“文件 > 另存为”。 选择另存的文件类型:PDF。 单击“保存”,生成PDF文件。 PDF文件生成后,可以导入视频制作界面使用。 父主题: 视频制作
获取语音文件上传地址 功能介绍 获取语音文件上传地址 调用方法 请参见如何调用API。
风格化照片建模生成的模型文件是什么格式? 风格化照片建模生成Glb格式的模型文件。 父主题: 照片建模
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。
在当前页面可以看到普通文件和问答题库的上传入口。 图3 我的知识库 上传普通文件操作。 单击“普通文件”区域的“上传文件”,进入“文件上传”页面,如图4所示。 图4 文件上传 设置“知识库名称”。 一个知识库可以是一堆文件的集合。 上传文件。
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。
超过24小时未上传资产主文件。 资产标题、描述和主文件内容审核失败。 服务校验资产主文件与用户创建的文件信息不匹配。 资产冻结说明 资产冻结说明,如表2所示。 表2 资产冻结说明 场景 操作说明 服务冻结租户资产 MetaStudio服务对租户资产内容的风险有一定连带责任。
提示“视频名称包含非法字符” 请您根据要求修改导出文件名称中的敏感字符。 提示“资产名称重复” 请您根据要求重新修改导出文件的名称。 视频任务合成状态一直显示“待合成” 可能是由于当前视频任务正在等待队列中,请您耐心等待。 父主题: 视频制作
创建技能 本节操作如下所示: 在MetaStudio控制台创建并导出技能文件 在科大讯飞创建同名技能后,导入技能文件 在MetaStudio控制台创建并导出技能文件 在MetaStudio控制台创建技能前,需要参考如下表格,在本地使用Excel文件,准备好技能问答对内容。
操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 参考真人声音录制,提前录制一个包含20句语料的WAV长音频文件,每句之间需要有2~3秒的停顿。语料推荐使用文案样例(基础版)。 声音授权签署文件。 操作步骤 登录MetaStudio控制台。
表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav 支持手机录制20条语料音频(5分钟),1-3天制作,快速获得类真人音色,mos分3.8。
创建TTS试听任务 功能介绍 该接口用于创建生成播报内容的语音试听文件任务。
同时需要删除训练任务相关的训练视频、身份证照片、授权文件、模型资产等。