检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建照片建模任务 功能介绍 该接口用于创建风格化照片建模任务。使用BASE64编码照片,通过JSON格式上传,生成风格化数字人模型。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human/stylized/picture-modelings-by-json
提供下述种方式,生成名片预览语音片段。 播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音
提供下述种方式,生成照片数字人播报内容。 播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音
基础版声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长3~10分钟,建议5分钟。 进阶版声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长10~30分钟,建议15分钟。 高品质声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长1小时以上,建议1小时。
录制的视频时长1~5分钟,建议2分钟,分辨率需≥1080P(4K最佳),宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄。支持MP4、MOV格式的视频,推荐MP4格式。 训练生成的分身数字人形象与真人形象完全相同。 声音制作语料类型 Flexus分身数字人制作任务会同时生成一个Flexus形象
问答库名称:输入问题库名称。 图7 创建问答库 单击“问答模板下载”,下载模板文件至本地,必须按照模板格式准备问答文件。 单击“选择文件”,上传已准备好的问答文件。 支持上传xlsx、xlm格式的文件,支持同时上传多个文件,每个文件不能超过20M。 单击“保存”,问答库新增成功。进入“问答库编辑”页面,如图8所示。
选取推理数据预处理视频起始时间。格式:“HH:MM:SS.mmm”。 video_end_time String 选取推理数据预处理视频结束时间。格式:“HH:MM:SS.mmm”。 chat_video_start_time String 选取推理数据预处理智能交互视频起始时间。格式:“HH:MM:SS
单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 单击“提交制作”。 数据上传完成后,界面提示“制作任务提交成功!”,如图2所示。 数字人
可多个状态查询,使用英文逗号分隔。 start_time 否 String 最近直播任务起始时间。格式遵循:RFC 3339 如“2021-01-10T08:43:17Z”。 end_time 否 String 结束时间。格式遵循:RFC 3339 如"2021-01-10T10:43:17Z"。 room_type
单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 授权书内容,可参考授权书。 单击“提交制作”。 数据上传完成后,界面提示“制作任务提交成功!”,如图2所示。
以下是数字人拍摄标准概览,但是我们也建议您详细阅读每一块具体内容: 拍摄规格 视频总时长5分钟,分辨率和帧率为4K/25fps或以上,格式为MP4/MOV。 场地布置 背景:使用颜色均匀、无破损、无褶皱的绿幕背景。 灯光:使用均匀、稳定的光照,标准日光色色温。保证拍摄者光线充
SUCCEED:成功 FAILED:失败 start_time String 任务开始时间,格式遵循:RFC 3339。 例 “2020-07-30T10:43:17Z”。 end_time String 任务结束时间,格式遵循:RFC 3339。 例 “2020-07-30T10:43:17Z”。
SUCCEED:成功 FAILED:失败 start_time String 任务开始时间,格式遵循:RFC 3339。 例 “2020-07-30T10:43:17Z”。 end_time String 任务结束时间,格式遵循:RFC 3339。 例 “2020-07-30T10:43:17Z”。
础上,增加贴图,丰富视频画面。 视频:无声音视频素材列表,支持本地导入,支持MOV、MP4、M4V、MKV、FLV、3GP、WMV和AVI格式的视频文件。支持添加为背景视频。 商品:商品列表。需要自定义创建商品,一个商品可以同时包含贴图、视频、文本和音频内容。 文本:文本模板列表
注意:MetaStudio服务目前仅支持读取docx(包含图文)、txt和md格式,其他格式暂不支持。 docx格式说明:可以没有标题和分级标题, 如需添加标题和分级标题,请使用word标准格式,如图5和图6所示。 txt格式说明:文档内容当前仅支持纯文本,一行对应一条知识。 星火大模型会理
图2 背景界面 背景界面说明,如表2所示。 表2 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择PNG、JPG和JPEG格式的图片上传。暂不支持4K以上的图片。 也支持直接拖拽本地图片至图片列表区域,完成上传操作。 界面默认展示两列图片,单击图标后,缩小展示为1列图片。单击图标,可恢复为2列展示。
按形象名称模糊查询。 start_time 否 String 最近智能交互对话任务起始时间。格式遵循:RFC 3339 如“2021-01-10T08:43:17Z”。 end_time 否 String 结束时间。格式遵循:RFC 3339 如"2021-01-10T10:43:17Z"。 请求参数
ime 否 String 资源过期时间段 开始时间。格式遵循:RFC 3339 如"2021-01-10T08:43:17Z" resource_expire_end_time 否 String 资源过期时间段 结束时间。格式遵循:RFC 3339 如"2021-01-10T08:43:17Z"
ime 否 String 资源过期时间段 开始时间。格式遵循:RFC 3339 如"2021-01-10T08:43:17Z" resource_expire_end_time 否 String 资源过期时间段 结束时间。格式遵循:RFC 3339 如"2021-01-10T08:43:17Z"
系统环境变量。 输入命令行ffmpeg后可以显示版本号,说明安装成功。 解决方法 通过剪映或者ffmpeg可以将H265(HEVC)视频的格式转码为H264,再上传至MetaStudio控制台,进行形象制作。 以ffmpeg为例,输入命令行:ffmpeg -i 视频文件名 -c:v