检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择“基础版声音制作”,音频格式为WAV或MP3文件。需整段录制,每句之间有2~3秒的停顿。音频时长3~10分钟,建议5分钟。 请完善声音信息 输入声音名称,示例:欢快女声。 请制作声音 使用“语料上传”的方式,直接上传一个已录制好的长音频WAV或MP3文件,无需压缩,无需携带文案txt文件。 请选择声音性别
客户声音制作案例 单击声音样例.zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav
声音和形象模型支持在其他平台使用吗? 不支持。声音和数字人模型文件不支持导出和下载,且声音和数字人模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 父主题: 声音和形象制作
创建TTS试听任务 功能介绍 该接口用于创建生成播报内容的语音试听文件任务。 第三方音色试听需要收费,收费标准参考:https://marketplace.huaweicloud.com/product/OFFI919400645308506112#productid=OFFI919400645308506112
删除分身数字人模型训练任务 功能介绍 该接口用于删除分身数字人模型训练任务。同时需要删除训练任务相关的训练视频、身份证照片、授权文件、模型资产等。 该接口应当在任务处于以下状态时调用:WAIT_FILE_UPLOAD、AUTO_VERIFY_FAILED、MANUAL_VERIF
String 音频文件是否已生成完成。该标记为PROCESSING时,应该每隔3秒再次调用本接口获取音频文件(WAITING 等待中,PROCESSING 处理中,SUCCEED 成功,FAILED 失败) audio_file_url String 音频文件下载链接,有效期为1个小时。
String 文件下载URL,有效期为24小时。 state String 文件状态枚举: CREATING:文件上传中 CREATED:文件已上传(自动审核通过) FAILED:文件上传失败 CANCELLED:文件上传已取消 DELETING:文件删除中 DELETED:文件已删除
形象声音授权 上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、jpeg、png格式的图片。 单击“上传授权书”,从本地选择pdf、jpg、jpeg或png格式的授权书上传。 授权书内容,可参考授权书。
PPT转视频的操作如下所示: 本地打开PPT文件,在左上方的导航栏中,选择“文件 > 导出”。 选择创建视频,可以设置每张幻灯片放映的时间等参数。 单击“创建视频”,在弹出的对话框中,选择本地存放目录,并设置视频名称。 单击“保存”,生成视频文件。 视频文件生成后,需要在视频制作界面的“视频”页签,导入使用。
String 文件下载URL,有效期为24小时。 state String 文件状态枚举: CREATING:文件上传中 CREATED:文件已上传(自动审核通过) FAILED:文件上传失败 CANCELLED:文件上传已取消 DELETING:文件删除中 DELETED:文件已删除
音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。 4 视频场景区域 如果一个视频包含多场景,可以新增场景依次制作,顺序播放。 5 文件设置区域 从左往右依次为: 单击文件名称右侧的图标,可自定义视频制作剧本的名称。
对话框。 图5 导入训练语料 单击“下载模板”,将语料模板下载至本地。 请按照模板文件的格式,填充完成所有问题分类及其语料对,保存文件。 单击“添加文件”,从本地选择文件,单击“确定”。 等待文件导入成功后,可以看到增加成功的问题类别及其全量语料对,示例如图6所示。 图6 批量导入语料
在“分身名片”页面,可以看到已生成的名片列表,以卡片形式排列展示。 支持对名片进行如下操作: 单击,查看分身数字人的语音表达形态。 单击“下载”,将名片下载至本地查看。下载后的文件为mp4格式。 单击,在弹出的下拉框中,可查看名片详情、重命名或删除名片。 图1 分身数字人名片 父主题: 数字人名片制作
FINISHED或ERROR或者WAITING job_id: 任务id audio_file_download_url: 音频文件路径 subtitle_file_download_url: 字幕文件路径 audio_duration: 音频时长(秒) 响应参数 状态码: 200 表5 响应Body参数
形象授权 上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 单击“提交制作”。
String 文件下载URL,有效期为24小时。 state String 文件状态枚举: CREATING:文件上传中 CREATED:文件已上传(自动审核通过) FAILED:文件上传失败 CANCELLED:文件上传已取消 DELETING:文件删除中 DELETED:文件已删除
唤醒:你好云笙、云笙你好 打断:稍等一下 退出:谢谢再见 更新唤醒模型 客户获取到MetaStudio定制的唤醒模型后,需替换原hwICSUiSdk文件modelData.js,之后将wasmData.js与modelData.js放置到项目的静态资源文件夹下面或者其他可以通过http请
String 字幕文件下载链接。 subtitle_file_upload_url String 字幕文件上传链接。 subtitle_file_state String 字幕文件生成状态。 GENERATING:字幕文件生成中。 GENERATE_SUCCEED:字幕文件生成成功。
视频直播 直播剧本保存失败怎么办? 提示模板不可用怎么办? 直播业务媒体流如何应对防火墙限制? 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 第三方平台的直播画面没有声音怎么办?
String 字幕文件下载链接。 subtitle_file_upload_url 否 String 字幕文件上传链接。 subtitle_file_state 否 String 字幕文件生成状态。 GENERATING:字幕文件生成中。 GENERATE_SUCCEED:字幕文件生成成功。