检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
注意:MetaStudio服务目前仅支持读取docx(包含图文)、txt和md格式,其他格式暂不支持。 docx格式说明:可以没有标题和分级标题, 如需添加标题和分级标题,请使用word标准格式,如图5和图6所示。 txt格式说明:文档内容当前仅支持纯文本,一行对应一条知识。 星火大模型会理
音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 回复问题的时候,支持同时在直播画面中展示图片或者视频信息,以加强回复效果。图片和视频的添加和设置方
础上,增加贴图,丰富视频画面。 视频:无声音视频素材列表,支持本地导入,支持MOV、MP4、M4V、MKV、FLV、3GP、WMV和AVI格式的视频文件。支持添加为背景视频。 商品:商品列表。需要自定义创建商品,一个商品可以同时包含贴图、视频、文本和音频内容。 文本:文本模板列表
T中有动画、动效,不支持在MetaStudio控制台展示,建议将PPT导出为视频后,再在导入本地视频的位置导入视频,进行视频制作。 PPT转视频的操作方法,如下所示: 本地打开PPT文件,在左上方的导航栏中,选择“文件 > 导出”。 选择创建视频,可以设置每张幻灯片放映的时间等参数。
示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 素材绑定(可选)
在左侧导航栏中,选择“知识库 > 问答管理”,进入“问答管理”页面,如图4所示。 图4 问答管理页面 用户可以选择下述一种方式,逐个新建问题分类及其语料,或者批量导入问题类别及其语料。 方式一:逐个新建问题分类及其语料。 单击图标,弹出“新建问题类别”对话框。 输入“问题类别名称”,示例:闲聊语料。
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST
苹果手机的简易录音机的采集位默认为16bit,无需修改。 声道 推荐使用单声道录制音频。 苹果手机的简易录音机默认为单声道录制,无需修改。 音频格式 推荐使用无损音质格式保存音频,如WAV、MP3格式。 音频命名 所有语料录制生成一个长音频WAV或MP3文件,命名示例:Voice.wav。 音频导出 操作如下所示:
编码为AV1、H264或H265格式。 AV1、H265编码格式目前支持Chrome浏览器,不支持Edge浏览器。 视频采样格式为YUV420。 视频素材总大小小于1GB。 同时叠加的视频总数量为3,包含互动时配置的视频。 音频格式 音频支持的格式为:MP3、M4A、WAV。 音频要求如下所示:
H265格式。 VP8、VP9编码仅WEBM视频支持。 WEBM视频如果为AV1编码格式,不支持合成视频。 AV1、H265编码格式目前支持Chrome浏览器,不支持Edge浏览器。 视频素材总大小小于1GB。 同时叠加的视频总数量最多支持2个。 音频格式 音频支持的格式为:MP3、M4A、WAV。
该部分可选。请求消息体通常以结构化格式(如JSON或XML)发出,与请求消息头中Content-Type对应,传递除请求消息头之外的内容。若请求消息体中的参数支持中文,则中文字符必须为UTF-8编码。 每个接口的请求消息体内容不同,也并不是每个接口都需要有请求消息体(或者说消息体为空),GET
创建照片建模任务 功能介绍 该接口用于创建风格化照片建模任务。使用BASE64编码照片,通过JSON格式上传,生成风格化数字人模型。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human/stylized/picture-modelings-by-json
风格化照片建模的照片有什么要求? 用于风格化照片建模的照片需要符合以下要求: 照片内容要求:正面照,脸部无遮挡。 照片格式要求:jpg/jpeg/png格式照片,最大分辨率为3840*2160。 父主题: 照片建模
SUCCEED:成功 FAILED:失败 start_time String 任务开始时间,格式遵循:RFC 3339。 例 “2020-07-30T10:43:17Z”。 end_time String 任务结束时间,格式遵循:RFC 3339。 例 “2020-07-30T10:43:17Z”。
提供下述种方式,生成名片预览语音片段。 播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音
提供下述种方式,生成照片数字人播报内容。 播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音
会话ID。 取值范围: 0-4294967295 output_data_version 否 String 输出数据的格式版本,如请求中无此参数,则输出数据格式为1.0,可选值有: 1.0: 对应的输出为: 动作数据:75个骨骼旋转值 表情数据:52ARkit表情及参数 2.0:
单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 单击“提交制作”。 数据上传完成后,界面提示“制作任务提交成功!”,如图2所示。 图2 制作任务提交成功
将鼠标放在需要停顿的文字右侧,单击“插入停顿”。在弹出的提示框中,选择“换气”或者停顿的时间,也支持自定义停顿时长。 连读 选中需要连读的文本内容,单击“连读”。 多音字 选中文本中的多音字,单击“多音字”,在弹出的提示框中,选择正确的发音或者自定义发音。 须知: 这里设置的多音字,仅对当前视频草稿有
objects 素材资产列表 create_time String 商品创建时间,格式遵循:RFC 3339。 例 “2020-07-30T10:43:17Z”。 update_time String 商品更新时间,格式遵循:RFC 3339。 例 “2020-07-30T10:43:17Z”。