检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
模型审核和制作可以加快吗? 为了保证模型质量,确保素材符合拍摄要求,训练前素材会经过人工审核。原则上不支持催审和加速,请耐心等待。模型审核制作耗时详情,如表1所示。 表1 模型制作耗时 模型类型 制作耗时 声音模型 声音模型制作耗时,如下所示: 基础版:约1~3个工作日。 进阶版:约1~3个工作日。
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI
技能管理”,如图1所示。 图1 智能交互页面 单击右上方的“创建技能”,弹出“创建技能”对话框,如图2所示。 参数配置说明,如表1表1所示。 支持用户最多创建100个技能。 图2 创建技能 表1 创建技能 参数 说明 技能名称 技能名称,必须与科大讯飞创建的技能一一对应,如在科大讯飞创建同名技能并导入技能文件所示。
智能交互设置 直播间页面支持弹幕规则使用“智能交互”的方式,去回复直播间用户的提问。智能交互的方式相当于提供了一个第三方语言模型去答复用户问题。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 在“
服务,使能千行百业场景应用。 您可以使用本文档提供的API对华为云MetaStudio服务进行相关操作,如形象制作、声音制作、视频制作等。支持的全部操作请参见API概览。 在调用华为云MetaStudio服务的API之前,请确保已经充分了解华为云MetaStudio服务的相关概念,详细信息请参见产品介绍。
操作前提 前提条件 需要申请开通智能交互权限后,才可集成智能交互SDK使用。 WebSDK使用限制 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 父主题: 智能交互客户端SDK
输出的语言受限制。使用自定义声音合成音频时,仅支持17种语言:中文、英文、德语、法语、土耳其语、菲律宾语、日语、意大利语、马来语、俄罗斯语、韩语、芬兰语、西班牙语、印尼语、阿拉伯语、葡萄牙语、荷兰语(暂未开放泰语)。 操作限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
创建应用:在科大讯飞的AIUI开放平台创建应用。 (可选)创建文档问答库:星火交互认知大模型应用,支持创建文档问答库。非必须创建,可根据实际情况选择使用。 MetaStudio服务目前仅支持读取docx(包含图文)、txt和md格式,其他格式暂不支持。 docx格式说明:可以没有标题和分级标题, 如需添加标题和分
至少小于等于“1/(帧率 * 4)”。 如帧率60,则快门速度小于1/240。 FAQ: 如果我的设备不能拍摄4K视频,只支持1080P怎么办? 若设备不支持,可尝试使用1080P(1080*1920)半身拍摄,以确保人脸区域的细节捕获。 我没有相机,能否使用手机拍摄 ? 目前我
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
制效果保持一致,包括服装、手部动作、面部表情以及各方面的姿态等。所以我们希望您在拍摄时尽可能保持自然,按照平时的说话习惯录制。 拍摄流程 支持手机或相机拍摄,需1080P或更高分辨率。 录制时长为2分钟,包含15秒静默转态和1分45秒的演讲过程。 允许使用中文、英文录制。 录制全
视频文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。 取值范围: 字符长度1-2048位。 默认取值: 不涉及。 video_cover_url 否 String 参数解释: 视频封面文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。
形象制作 MetaStudio服务支持自定义生成分身数字人。 操作前准备 用户创建分身数字人定制任务前,需要参考操作步骤准备如下内容: 5~6分钟绿幕拍摄视频。 注意:如果制作分身形象的时候,选择保留拍摄背景,则需要准备实景背景拍摄视频。 身份证正反面照片。 形象授权签署文件,如授权书所示。
也可以通过本声明“如何联系我们”章节中所述联系方式与我们取得联系,我们将尽力协调、支持并保障您的上述权利实现。 信息存储地点及期限 1. 存储地 上述信息将会传输并保存至中华人民共和国境内的服务器。 2. 存储期限 我们仅在实现本声明所述目的所必需的时间内保留您的个人信息,并在超
声音制作 MetaStudio支持自定义生成声音。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 参考真人声音录制,提前录制一个WAV或MP3格式的长音频文件,每句之间需要有2~3秒的停顿。语料推荐使用文案样例(基础版)。 声音授权签署文件。 操作步骤 登录MetaStudio控制台。
创建大文件 功能介绍 该接口用于创建大文件(超过5G),获取分段上传URL。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/large-files 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。
如何集成MetaStudio服务? MetaStudio支持通过API方式被集成使用,详见API参考、SDK参考和应用示例。具体对接事宜,可以联系客户经理处理。 如需商务对接,请提供企业名、企业所在地域、联系方式等信息,简要说明需要集成MetaStudio的能力和用途,然后提交工单处理。
激活资源 目前支持购买的资源类型,如表1所示。 需激活“一次性计费”产品后使用,必须在一年内激活,否则无法再激活使用。从激活日期开始计算,产品有效期为一年。 按需套餐包和包年/包月产品,可直接使用,无需激活。必须在有效期内使用完成,超出有效期后,自动失效。 表1 资源类型 服务类型
视频文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。 取值范围: 字符长度1-2048位。 默认取值: 不涉及。 video_cover_url String 参数解释: 视频封面文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。