检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
客户声音制作案例 单击声音样例.zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav
String 文件下载URL,有效期为24小时。 state String 文件状态枚举: CREATING:文件上传中 CREATED:文件已上传(自动审核通过) FAILED:文件上传失败 CANCELLED:文件上传已取消 DELETING:文件删除中 DELETED:文件已删除
音频数据训练上传URL。该url在文件上传成功后失效,只能上传一次 说明: 通过该地址上传时,需设置content-type为application/zip。 cover_upload_url String 模型封面上传URL。该URL在文件上传成功后失效,只能上传一次。 说明: 通过该地址上传时,
需整段录制所有语料生成一个长音频WAV或MP3格式文件,每句之间有2~3秒的停顿。WAV或MP3格式文件可直接上传MetaStudio控制台,无需压缩,无需提供语料txt文件。 推荐使用服务预置语料,也可自定义语料。系统会自动根据停顿做切割,自动识别文本内容。 音频文件命名无要求,可自定义,命名示例:Voice
约束限制: 该配置仅用于模板 取值范围: PRIVATE:私有,仅本租户可访问。 PUBLIC:公开,所有租户可访问。当前仅提供系统资产可公开访问。 SHARED:共享,指定租户可访问。拥有者指定租户可访问。 默认取值: 不涉及。 shared_state 否 String 参数解释:
基础版声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长3~10分钟,建议5分钟。 进阶版声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长10~30分钟,建议15分钟。 高品质声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长1小时以上,建议1小时。 每种声音
约束限制: 该配置仅用于模板 取值范围: PRIVATE:私有,仅本租户可访问。 PUBLIC:公开,所有租户可访问。当前仅提供系统资产可公开访问。 SHARED:共享,指定租户可访问。拥有者指定租户可访问。 默认取值: 不涉及。 shared_state String 参数解释:
上传图片时提示像素超标怎么办? 图片像素不是文件大小,如果用户仅修改图片大小,控制台还会继续提示像素超标。 上传图片的长宽需要至少满足下述一个条件: (width <= 2160) & (height <= 3840) (width <= 3840) &(height <= 2160)
音,仅支持企业用户。 定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 使用限制 制作好的声音模型不支持下载或导出至本地。 声音模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 父主题: 使用限制
String 字幕文件下载链接。 subtitle_file_upload_url String 字幕文件上传链接。 subtitle_file_state String 字幕文件生成状态。 GENERATING:字幕文件生成中。 GENERATE_SUCCEED:字幕文件生成成功。
单击新增应用所在行的图标,进入“应用配置”页面。 在左侧导航栏中,选择“应用数据统计 > 服务统计”,进入“服务统计”页面,如图1所示。 通过下图可以看出,科大讯飞免费赠送500次/天的问答交互。 图1 服务统计页面 单击“剩余(次数)”“500”下方的“提升交互次数”,可以按照
String 字幕文件下载链接。 subtitle_file_upload_url String 字幕文件上传链接。 subtitle_file_state String 字幕文件生成状态。 GENERATING:字幕文件生成中。 GENERATE_SUCCEED:字幕文件生成成功。
百业,通过AI数字人辅助,让每个人都能成为专业的主播。以下是几个行业案例: 信息无障碍研究会致力于推动中国无障碍发展,华为云MetaStudio联合信息无障碍研究会,为听障人士打造分身数字人,让声音重现焕发新生,助力让每个人都能通过科技平等享受现代文明。聋哑画家史晓慧,通过数字分
企业用户。 定制分身形象时,从平台下载的授权书中有明确说明,定制分身形象需授权给公司使用。 使用限制 制作好的数字人模型不支持下载或导出至本地。 数字人模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 数字人不支持换脸、换衣服。
约束限制: 该配置仅用于模板 取值范围: PRIVATE:私有,仅本租户可访问。 PUBLIC:公开,所有租户可访问。当前仅提供系统资产可公开访问。 SHARED:共享,指定租户可访问。拥有者指定租户可访问。 默认取值: 不涉及。 shared_state 否 String 参数解释:
输入声音名称。 示例:欢快女声。 请制作声音 界面提供录音指导,需要按照指导录制1分钟的长音频WAV或MP3文件。WAV或MP3文件支持直接上传,无需压缩,无需携带文案txt文件。 如果未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景。 请选择声音性别 声音的性别,用于匹配声音模型的精准度。
特性讲解 数字内容生产线 MetaStudio产品介绍 17:43 详细了解MetaStudio服务 服务访问路径 数字内容生产线 访问MetaStudio服务 00:50 访问MetaStudio服务 声音制作和形象制作 声音制作 操作指导 00:50 分身数字人声音制作操作指导
系统的声音输出设备不一致导致。 检查方法如下所示: 检查OBS桌面音频设备 检查Windows系统的声音输出设备 检查OBS桌面音频设备 本地打开OBS视频采集工具。 在界面下方,选择“混音器”。 图1 OBS工具 单击“桌面音频”区域的图标,在弹出的下拉框中,选择“属性”,弹出桌面音频属性设置对话框,如图2所示。
String 字幕文件下载链接。 subtitle_file_upload_url 否 String 字幕文件上传链接。 subtitle_file_state 否 String 字幕文件生成状态。 GENERATING:字幕文件生成中。 GENERATE_SUCCEED:字幕文件生成成功。
String 字幕文件下载链接。 subtitle_file_upload_url String 字幕文件上传链接。 subtitle_file_state String 字幕文件生成状态。 GENERATING:字幕文件生成中。 GENERATE_SUCCEED:字幕文件生成成功。