检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
语言仅支持中文和英文。 视频中提取声音:直接提取训练视频中的声音,训练生成Flexus声音。 视频中的语言仅支持中文和英文。 须知:“单独上传语料包”的方式生成Flexus声音的效果会更好。 数字人名称 生成的Flexus数字人名称。 示例:云笙。 联系方式 请输入有效的11位手机号码。
第三方平台开播指南 MetaStudio直播功能的主要作用是生成数字人直播的音视频内容,并非直播平台。 可以通过下述2种方式在第三方平台开播: 窗口捕获方式开播:MetaStudio直播返回的窗口可供第三方直播平台(淘宝、抖音、拼多多等)抓取用于开播。 RTMP推流:即RTMP直
频为标准版形象,不支持选择Flexus声音进行视频合成。 试听 单击“试听”,试听语音效果。 生成预览 单击“生成预览”,选择“当前场景”或者“所有场景”,生成预览视频,可预览视频生成后的效果。 图标 单击图标,放大展示“文本驱动”页签,提升用户操作体验。 单击“确定”,可关闭页面。
出海营销视频制作。 只需要上传文案就可以生成一条真人模特出镜,多语言的口播讲解介绍视频,还支持上传图片、产品视频、企业logo、添加文字贴图背景音乐等编辑功能。 目前已经支持桌面端、移动端安卓iOS都可以直接下载使用。 在九月,还将上线在线端,到时候只需要打开浏览器就可以制作数字人视频。
PPT转PDF的操作如下所示: 本地打开PPT文件,在左上方的导航栏中,选择“文件 > 另存为”。 选择另存的文件类型:PDF。 单击“保存”,生成PDF文件。 PDF文件生成后,可以导入视频制作界面使用。 父主题: 视频制作
独的资产管理包月产品。 定制形象模型存储 基于MetaStudio服务定制生成的形象模型,其所包含的音色模型所占存储空间,暂不计入租户资产存储计费中。 定制视频资产存储 基于MetaStudio服务定制生成的视频资产,6个月以内不计入资产存储空间计费;满6个月以后,参与计费。 资产存储计费说明
视频画面制作区域,可以制作和预览视频画面。 3 音频制作区域 音频制作区域,可选择下述1种方式生成音频。 文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视
任务审核通过后,才能进行算法训练,会在3个工作日内训练完成并生成数字人。 Flexus分身数字人 数字人定制任务提交成功后,会在1个工作日内完成审核。任务审核通过后,才能进行算法训练,会在3个工作日内训练完成并生成数字人。 父主题: 声音和形象制作
具备如下特点: 2D模型,通过拍摄真人视频训练生成 无表情&骨骼数据 只能由AI驱动 使用既定表情&动作 IP型数字人:由计算机图形学技术创造出来的与人类形象高度接近的数字化形象。 具备如下特点: 3D模型,通过艺术设计生成 有表情、骨骼数据 可由真人动作驱动 能呈现自定义表情&动作
SYSTEM_MARKABLE_VIDEO:标记视频生成任务 SYSTEM_MASK_VERIFY_VIDEO:校验视频生成任务 SYSTEM_MASK_VERIFY_VIDEO_SUCCESS:校验视频生成成功 SYSTEM_MASK_VERIFY_VIDEO_FAILED:校验视频生成失败 SYSTEM_M
对下载的SDK安装包进行完整性校验,判断下载过程是否存在篡改和丢包现象。 操作步骤 参考下载SDK安装包,下载SDK安装包至本地。 打开本地命令运行程序,输入如下命令,在本地生成SDK安装包的SHA256值。 其中,“D:\HwICSUiSdk-1.0.0.zip”为SDK安装包的本地存放路径及安装包名称,请根据实际情况修改。
照片建模 照片建模任务创建失败是什么原因? 照片建模任务出现异常问题怎么办? 风格化照片建模的照片有什么要求? 风格化照片建模生成的模型文件是什么格式? 表情驱动数据格式如何定义? 肢体驱动数据格式如何定义?
分身视频制作 视频制作剧本管理 数字人视频制作管理 分身数字人视频制作管理 数字人名片制作管理 照片数字人视频制作管理 分身数字人字幕文件生成管理
计费项说明 类别 计费项 计费说明 计费方式 分身数字人 Flexus分身数字人 按Flexus数字人生成个数和声音克隆个数计费。 须知: 每提交一个Flexus分身数字人定制任务,会同时生成一个Flexus形象和一个Flexus声音,对应消耗一个形象资源和一个声音资源。 按需预付费套餐包
Command命令说明 直播控制RTSA Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值 预置音色ID列表 查询音色ID
获取语音训练任务审核结果 20次/秒 10次/秒 10次/秒 设置任务批次 10次/秒 3次/秒 3次/秒 确认在线录音结果 10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件
在左侧导航栏中,单击“任务中心”。 选择“声音制作”,确认声音制作任务已训练完成。 在左侧导航栏中,单击“我的创作”。 选择“声音”,找到已生成的声音,单击声音卡片中的头像,即可试听声音效果。 用户还可以执行如下操作: 单击“视频制作”,基于已有声音,进行视频制作,操作请参考视频制作。
wav~99.wav;文本文件命名规则:0.txt~99.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
/v1/{project_id}/photo-detection/{job_id} 查询照片检测任务详情 分身数字人字幕文件生成管理 表8 分身数字人字幕文件生成管理接口 接口 说明 POST /v1/{project_id}/subtitle-files 创建分身数字人视频字幕文件
获取语音训练任务审核结果 20次/秒 10次/秒 10次/秒 设置任务批次 10次/秒 3次/秒 3次/秒 确认在线录音结果 10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件