-
确认在线录音结果 - 数字内容生产线 MetaStudio
确认在线录音结果 功能介绍 确认在线录音结果。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/training-segment 表1 路径参数 参数 是否必选 参数类型 描述 project_id
-
获取在线录音确认结果 - 数字内容生产线 MetaStudio
获取在线录音确认结果 功能介绍 获取在线录音确认结果。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/training-segment 表1 路径参数 参数 是否必选 参数类型 描述 project_id
-
开发者如何获取技术支持? - 数字内容生产线 MetaStudio
服务处理。 详细操作如下所示: 访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。 服务会在收到问题单后,联系您处理。
-
开发者如何获取技术支持? - 数字内容生产线 MetaStudio
服务处理。 详细操作如下所示: 访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。 服务会在收到问题单后,联系您处理。
-
声音制作任务管理 - 数字内容生产线 MetaStudio
查询语音训练任务列表 提交语音训练任务 查询语音训练任务详情 删除语音训练任务 获取语音文件上传地址 获取语音训练任务审核结果 确认在线录音结果 获取在线录音确认结果
-
产品优势 - 数字内容生产线 MetaStudio
全球一张网(算网融合、超低时延),通过华为云盘古数字人大模型,训练生成数字人、数字物、数字空间,实现数字人视频制作、直播、智能交互和数字人IP代言等场景。 数字人升级迭代快,提升产品竞争力 口型精准:口型匹配度>95%,多语种无缝切换,泛化能力强。 表情自然:通过AI眼神矫正,矫正前后眼部ID一致,避免眼神不聚焦。
-
创建进阶版语音训练任务 - 数字内容生产线 MetaStudio
bs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0.wav~99.wav;文本文件命名规则:0.txt~99.txt。
-
创建声音制作任务 - 数字内容生产线 MetaStudio
需要录制500句以上的音频。音频仅支持wav格式。建议整段录制生成一个长音频文件,直接上传,无需压缩,无需携带文案txt文件。 在线录音:需要用户在线录制,先单击“开始环境检测”。首次录制界面会弹出提示,需要允许使用您的麦克风。当界面显示“录制环境合格”时,单击下方的“开始录音”
-
创建基础版语音训练任务 - 数字内容生产线 MetaStudio
bs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0.wav~19.wav;文本文件命名规则:0.txt~19.txt。
-
制作照片数字人视频 - 数字内容生产线 MetaStudio
播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选
-
创建角色 - 数字内容生产线 MetaStudio
敏感词话术 如果用户问题中有敏感词,使用此话术作答。 示例:哎呦,这个问题我没有听懂哦!请您重新提问。 单击“在线演示”,可以在界面右侧演示模型对话效果,如图4所示。 图4 在线演示 单击界面右上角的“保存”,在弹出的“保存成功”提示框中,单击“确定”。 角色创建完成。 父主题: 创建智能交互数字人(奇妙问)
-
SDK概述 - 数字内容生产线 MetaStudio
华为云提供了MetaStudio服务端SDK,您可以直接集成服务端SDK来调用MetaStudio的相关API,从而实现对MetaStudio服务的快速操作。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 您可以在API Explor
-
制作名片 - 数字内容生产线 MetaStudio
播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选
-
API概览 - 数字内容生产线 MetaStudio
o-scripts 创建视频制作剧本 GET /v1/{project_id}/digital-human-video-scripts 查询视频制作剧本列表 GET /v1/{project_id}/digital-human-video-scripts/{script_id} 查询视频制作剧本详情
-
构造请求 - 数字内容生产线 MetaStudio
名称 描述 是否必选 示例 Host 请求的服务器信息,从服务API的URL中获取。值为hostname[:port]。端口缺省时使用默认的端口,https的默认端口为443。 否 使用AK/SK认证时该字段必选。 code.test.com or code.test.com:443
-
形象制作 - 数字内容生产线 MetaStudio
型训练过程较长,约10个小时左右,请耐心等待。 图5 数字人定制任务 等待数字人模型训练完成后,任务状态变更为“算法训练完成”,如图6所示。 图6 数字人定制任务 如果训练生成的数字人形象满足需求,单击右下方的“通过”。在弹出的“确认”对话框中,单击“确认”,数字人形象生成完成。
-
API使用限制 - 数字内容生产线 MetaStudio
获取语音文件上传地址 20次/秒 10次/秒 10次/秒 获取语音训练任务审核结果 20次/秒 10次/秒 10次/秒 确认在线录音结果 10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件
-
创建分身数字人视频制作任务 - 数字内容生产线 MetaStudio
ShootScriptItem 参数 是否必选 参数类型 描述 sequence_no 否 Integer 剧本序号。 shoot_script 是 ShootScript object 表演脚本。 表8 ShootScript 参数 是否必选 参数类型 描述 script_type
-
复制视频制作剧本 - 数字内容生产线 MetaStudio
igital-human-video-scripts/26f06524-4f75-4b3a-a853-b649a21aaf66/copy { "script_name" : "大自然的传说", "script_description" : "课件", "model_asset_id"
-
创建大文件 - 数字内容生产线 MetaStudio
POST https://{endpoint}/v1/6a6a1f8354f64dd9b9a614def7b59d83/files { "file_name" : "1.png", "file_type" : "zip", "asset_id" : "8cb2f48a