检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
文案样例(基础版) 直播带货风格文案 营销宣传风格文案 新闻播报风格文案 直播带货风格英文文案 营销宣传风格英文文案 新闻播报风格英文文案 父主题: 声音制作
在优惠期间购买的家用机器人将享受售后服务和升级支持。 价格之低令人心动。还等什么? 赶快行动起来,带上家用机器人,开启智能家居新篇章! 父主题: 文案样例(基础版)
home the home robot, and start a new chapter in smart homes! 父主题: 文案样例(基础版)
能驱动,实现视频制作、视频直播、智能交互等能力。 华为云盘古数字人大模型,赋能千行百业数字化营销新模式 MetaStudio服务依托华为云基础设施、海量算力(CPU/GPU/NPU)、全球一张网(算网融合、超低时延),通过华为云盘古数字人大模型,训练生成数字人、数字物、数字空间,
否是下述原因导致: 电脑是否有独立显卡。 OBS视频采集工具的基础分辨率配置是否与输出分辨率一致。 检查独立显卡 用户使用的第三方直播平台所在电脑,必须装有独立显卡。 检查OBS视频分辨率配置 OBS视频采集工具的基础分辨率和输出分辨率的值需要保持一致。 检查方法如下所示: 本地打开OBS视频采集工具。
形象制作Flexus版 个 modeling_count_2d_model_flexus - 形象制作高级版 个 modeling_count_2d_model_advance 当前未启用 声音制作基础版 个 voice_clone_basic - 声音制作进阶版 个 voice_clone_middle
据悉,今年上半年,中国造船三大指标全面增长, 造船完工量,新接订单量,手持订单量,三大指标的国际市场份额均为全球第一。 父主题: 文案样例(基础版)
new orders, and order backlog, is ranked first in the world. 父主题: 文案样例(基础版)
pm tomorrow night. Don't forget to come and watch! Bye bye. 父主题: 文案样例(基础版)
宝宝们,我们的直播还有十分钟就要结束了,大家还有什么疑问都可以打在公屏上! 我们准备下播咯,跟大家预告一下明天我们的开播时间是晚上八点,记得来看哦!拜拜 父主题: 文案样例(基础版)
同一批录音必须使用同一套录制设备和环境。 建议使用对应版本预置的文案样例:文案样例(基础版)、文案样例(进阶版)、文案样例(高品质)。 支持自定义文案,单句文案长短需和样例相当。 不建议临场即兴发挥录制,避免出现较多嗯、啊等语气词,影响连贯性。 进阶版 高品质 专业录音棚+高保真MIC录制。 开始录音 必须
否是下述原因导致: 电脑是否有独立显卡。 OBS视频采集工具的基础分辨率配置是否与输出分辨率一致。 检查独立显卡 用户使用的第三方直播平台所在电脑,必须装有独立显卡。 检查OBS视频分辨率配置 OBS视频采集工具的基础分辨率和输出分辨率的值需要保持一致。 检查方法如下所示: 本地打开OBS视频采集工具。
Markup Language)来控制数字人的行为,包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。MetaStudio在此基础上,扩展了一些字段用于实现数字人的控制。 MetaStudio SSML当前支持如下能力: TTS语音合成时,控制文字读音。
文案样例(进阶版) 直播带货风格文案 营销宣传风格文案 新闻播报风格文案 直播带货风格英文文案 营销宣传风格英文文案 新闻播报风格英文文案 父主题: 声音制作
用户创建声音制作任务前,需要参考操作步骤准备如下内容: 参考真人声音录制,提前录制一个WAV或MP3格式的长音频文件,每句之间需要有2~3秒的停顿。语料推荐使用文案样例(基础版)。 声音授权签署文件。 操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 图1 定制声音
表1 界面操作说明 区域 说明 声音制作方式 MetaStudio提供下述声音制作方式: 基础版声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长3~10分钟,建议5分钟。 进阶版声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长10~30分钟,建议15分钟。
声音录制指导文档下载 创建声音制作任务(自研模型) 创建声音制作任务(第三方模型) 查看声音 声音更新记录 购买声音套餐 文案样例(基础版) 文案样例(进阶版) 文案样例(高品质)
声音制作任务管理 查询用户配置的个性化音频时长 创建基础版语音训练任务 创建进阶版语音训练任务 创建高级版语音训练任务 查询语音训练任务列表 提交语音训练任务 查询语音训练任务详情 删除语音训练任务 查询任务操作日志 获取语音文件上传地址 获取语音训练任务审核结果 设置任务批次 确认在线录音结果
合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav 支持手机录制20条语料音频(5分钟),1-3天制作,快速获得类真人音色,mos分3.8。 短视频制作 进阶版声音制作 女声 进阶版媒体1.wav 进阶版媒体2.wav 支持手机录制10