检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
10次/秒 10次/秒 复制资产 4次/秒 3次/秒 3次/秒 文件管理 创建文件并获取上传URL 10次/秒 5次/秒 5次/秒 删除文件 10次/秒 5次/秒 5次/秒 确认文件已上传 10次/秒 5次/秒 5次/秒 创建大文件 10次/秒 5次/秒 5次/秒 视频制作剧本管理 创建视频制作剧本
选择“基础版声音制作”,音频格式为WAV或MP3文件。需整段录制,每句之间有2~3秒的停顿。音频时长3~10分钟,建议5分钟。 请完善声音信息 输入声音名称,示例:欢快女声。 请制作声音 使用“语料上传”的方式,直接上传一个已录制好的长音频WAV或MP3文件,无需压缩,无需携带文案txt文件。 请选择声音性别
视觉驱动的含义:通过摄像头采集真人运动数据,驱动数字人运动。 按需计费 包年/包月 资产管理 资产管理 按资产管理的规格(资产存储空间)进行计费。 需注意: 首次购买或创建资产时,免费赠送5G存储空间。 下述场景,使用资产空间不会计费: 用户上传的分身数字人模型、3D数字人模型和声音。 平台生成的分身数字人模型、3D数字人模型和声音。
MSS.47000013 model file down fail 请检查人物模型资产文件是否存在,不存在请更换人物模型,如果存在请联系技术支持 MSS.47000014 background file down fail 请检背景图片资产文件是否存在,不存在请更换背景,如果存在请联系技术支持
variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment String ak = System.getenv("CLOUD_SDK_AK"); String sk = System.get
客户声音制作案例 单击声音样例.zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav
话术配置。 play_type 否 String 播放类型。 取值如下所示: APPEND:在播放队列的尾部追加播放。 INSERT:在两个音频文件中间插入播放,或在当前正播放文本的句末插入播放。 PLAY_NOW:收到指令后,立即插入播放。无需等待当前文本播放至句末。 默认值:PLAY_NOW。
租户级自定义读法配置、修改TTS租户级自定义读法配置。 2024-12-05 第十三次正式发布 本次变更如下: 新增接口组:分身数字人字幕文件生成管理。 新增接口组:第三方直播平台管理。 2024-11-30 第十二次正式发布 本次变更如下: 语音合成管理接口组,新增接口:创建TTS异步任务、获取TTS异步任务。
列展示。 关键词搜索框,可输入文件名称进行精准搜索。 示例:销售指导书。 文件列表 默认展示全量文件。 查看文件 将鼠标放在文件上方,文件右上角展示图标。单击图标,可以在弹出的界面中预览PPT的所有页面内容。 插入文件 将鼠标放在文件上方,文件右上角展示图标。单击图标,弹出如图4
PPT转视频的操作方法,如下所示: 本地打开PPT文件,在左上方的导航栏中,选择“文件 > 导出”。 选择创建视频,可以设置每张幻灯片放映的时间等参数。 单击“创建视频”,在弹出的对话框中,选择本地存放目录,并设置视频名称。 单击“保存”,生成视频文件。 视频文件生成后,需要在视频制作界面的“视频”页签,导入使用。
工具运行界面 视频转换过程中,工具的同级目录下面会出现一些过程文件,请勿移动或删除,待视频格式转换完成后,会自动删除。 图3 工具目录 视频格式转换完成后,WEBM视频文件的同级目录下面会生成一个同名带时间戳的MOV文件。 文件名示例如下所示: 原始频名称:test.webm 转换后的
基础版声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长3~10分钟,建议5分钟。 进阶版声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长10~30分钟,建议15分钟。 高品质声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长1小时以上,建议1小时。 每种声音
导入图片。 PPT:PPT文件列表,需要用户从本地导入后使用。 贴图:各类贴图列表,可本地导入素材。支持在当前画面基础上,增加贴图,丰富视频画面。 视频:各类无声音视频列表,可本地导入视频文件。支持添加为背景视频。 音乐:各类音乐列表,可本地导入音频文件。支持添加为背景音乐。 文本:用于在画布中添加文本。
形象声音授权 上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、jpeg、png格式的图片。 单击“上传授权书”,从本地选择pdf、jpg、jpeg或png格式的授权书上传。 授权书内容,可参考授权书。
37118098b CertUtil: -hashfile 命令成功完成。 参考表1,下载SDK安装包完整性校验文件至本地。 使用文本编辑器打开完整性校验文件,查看文件中的SHA256值和2中生成的SHA256值是否一致。 如果一致,说明SDK安装包下载过程中,不存在篡改和丢包现象。
需整段录制所有语料生成一个长音频WAV或MP3格式文件,每句之间有2~3秒的停顿。WAV或MP3格式文件可直接上传MetaStudio控制台,无需压缩,无需提供语料txt文件。 推荐使用服务预置语料,也可自定义语料。系统会自动根据停顿做切割,自动识别文本内容。 音频文件命名无要求,可自定义,命名示例:Voice
左下角展示用户已购买资源的剩余量。 资产管理 资产管理 左下角展示资产存储空间的已使用量,单位:GB。 须知: 用户首次使用MetaStudio服务,会免费赠送5G的存储空间。 资源总量默认包含免费赠送的5G存储空间。 目前资产管理,在内侧免费体验中,所以存储空间可以为负数。内测体验到期后,会在Metastudio控制台进行公告提醒。
在“分身名片”页面,可以看到已生成的名片列表,以卡片形式排列展示。 支持对名片进行如下操作: 单击,查看分身数字人的语音表达形态。 单击“下载”,将名片下载至本地查看。下载后的文件为mp4格式。 单击,在弹出的下拉框中,可查看名片详情、重命名或删除名片。 图1 分身数字人名片 父主题: 数字人名片制作
形象授权 上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 单击“提交制作”。
输入声音名称。 示例:欢快女声。 请制作声音 界面提供录音指导,需要按照指导录制1分钟的长音频WAV或MP3文件。WAV或MP3文件支持直接上传,无需压缩,无需携带文案txt文件。 如果未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景。 请选择声音性别 声音的性别,用于匹配声音模型的精准度。