检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
确认文件已上传 功能介绍 资产文件上传完毕后,通过该接口确认上传完成。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/files/{file_id}/complete 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是
asset_file_category 是 String 文件在资产中的分类。每种资产类型包含的文件分类不同。 MAIN:主文件 OTHER:其他文件 PACKAGE:打包后的资产文件 file_multipart_count 否 Integer ORI4K文件分段上传数量,默认值为1 取值范围: 1-100
是 String 参数解释: 文件在资产中的分类。每种资产类型包含的文件分类不同。 MAIN:主文件 COVER:封面文件 PAGE:PPT内容页图片文件 SAMPLE:样例音频或样例动作文件 OTHER:其他文件 WHOLE_MODEL:全模型文件(3D数字人) USER_MO
文件管理 创建文件并获取上传URL 删除文件 确认文件已上传 创建大文件 父主题: 资产管理
视频合成失败如何处理? 视频合成失败时,请您根据界面提示信息进行问题定位及修改。 提示“视频名称包含非法字符” 请您根据要求修改导出文件名称中的敏感字符。 提示“资产名称重复” 请您根据要求重新修改导出文件的名称。 视频任务合成状态一直显示“待合成” 可能是由于当前视频任务正在等待队列中,请您耐心等待。
获取TTS试听文件 功能介绍 该接口用于获取TTS试听文件下载链接,返回List中包含当前已生产的试听文件。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/ttsc/audition-file/{job_id} 表1 路径参数 参数 是否必选
接收资产 支持接收资产管理员或其他租户转移给当前租户的声音和分身模型资产。声音和分身模型资产的接收、激活操作均相同,下面以分身模型资产为例进行操作演示。 注意事项 管理员或其他租户如果推送声音或分身模型资产给当前租户,当前租户需在7天内完成接收和激活操作。如果超过7天未操作,需要
支持在视频制作界面,导入本地PPT作为视频素材使用。如果PPT中有动画、动效,不支持在MetaStudio控制台展示,建议将PPT导出为视频后,再在导入本地视频的位置导入视频,进行视频制作。 PPT转视频的操作方法,如下所示: 本地打开PPT文件,在左上方的导航栏中,选择“文件 > 导出”。
转移资产 当前租户支持转移声音和分身模型资产给其他租户。声音和分身模型资产的转移操作均相同,下面以分身模型资产为例进行操作演示。 前提条件 如果当前租户希望转移资产给其他租户,需要提交工单或联系大客户经理,并提供已获取的项目ID,申请加入白名单。 租户所在Region的项目ID获取方法,请参见获取项目ID。
在MetaStudio控制台完成交互配置,包括LLM或者大模型配置,通过Web页面浏览,无需开发。 图1 智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交互服务定义的API接口结构,自主开发第三方语言模型API,对接第三方语言模型到智能交互服务,实现智能交互能
前提条件 MetaStudio创建对话时,如果“第三方应用”需要选择“科大讯飞AIUI通用语义模型”或“科大讯飞星火交互认知大模型”时,才需要执行创建智能交互数字人(科大讯飞)操作,详情请参考表1。 父主题: 创建智能交互数字人(科大讯飞)
照片建模任务创建失败是什么原因? 可能是由于创建资产出现问题,建议您重试下。 父主题: 照片建模
根据具体描述处理 400 MSS.45000017 文件无法读取 onnx文件读取失败 请联系技术支持 400 MSS.45000018 模型文件帧序号错误 模型文件帧序号错误 不会被触发,忽略 400 MSS.45000019 文件解压失败 模型文件解压失败 请联系技术支持 400 MSS.45000020
获取语音文件上传地址 功能介绍 获取语音文件上传地址 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs/{job_id}/uploading-address-url 表1 路径参数 参数
部分浏览器提交H265训练视频失败如何处理? 问题描述 制作分身形象时,上传的训练视频无法播放,或提交训练任务时,提示分辨率不符合要求,如下图所示。 图1 分身形象制作 问题原因 由于Chrome等浏览器只支持硬解码H265(HEVC)视频,当您的PC硬件不支持解码H265(HE
需整段录制所有语料生成一个长音频WAV或MP3格式文件,每句之间有2~3秒的停顿。WAV或MP3格式文件可直接上传MetaStudio控制台,无需压缩,无需提供语料txt文件。 推荐使用服务预置语料,也可自定义语料。系统会自动根据停顿做切割,自动识别文本内容。 音频文件命名无要求,可自定义,命名示例:Voice
系统资产标签定义 查询资产列表接口支持使用“tags”标签对分身数字人模型进行分类。 “tags”取值及其含义,如表1所示。 表1 tags标签说明 tags取值类型 说明 数字人类型 取值如下: VIRTUAL_AVATARS:分身数字人 VIRTUAL_HUMANS:虚拟数字人
图1 直播状态变化流程图 流程图说明,如下所示: PREPROCESSING:MetaStudio直播服务启动加载形象模型的状态。 PLAY_READY:形象模型加载完成的状态。此时数字人处于静默状态,等待开始播放剧本的指令。 PROCESSING:数字人的工作状态。数字人会根据直播任务中预置的文本或音频进行直播。
本节操作如下所示: 在MetaStudio控制台创建并导出技能文件 在科大讯飞创建同名技能后,导入技能文件 在MetaStudio控制台创建并导出技能文件 在MetaStudio控制台创建技能前,需要参考如下表格,在本地使用Excel文件,准备好技能问答对内容。 表1 智能交互问答对参考 序号
小语种克隆支持的语言类型 支持第三方模型“出门问问”:支持19种输入语言(中文、英文、粤语、德语、法语、土耳其语、菲律宾语、日语、意大利语、马来语、俄罗斯语、韩语、芬兰语、荷兰语、西班牙语、印尼语、阿拉伯语、葡萄牙语、泰语)的声音制作,操作请参考创建声音制作任务(第三方模型)。 父主题: 购买声音套餐