检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
右侧界面的预览效果就是数字人名片的实际生成效果,请输入适量的字符,以确保正常的展示效果。 公司 必填项,数字人公司。 内容较多时,最多支持在名片中分2行展示,超出2行后,默认不展示。为保证名片的效果展示,请保持合理的输入长度。 联系电话 必填项,数字人联系电话,请输入有效的联系方式。 公司地址
e浏览器,不支持Edge浏览器。 视频素材总大小小于1GB。 同时叠加的视频总数量最多支持2个。 音频格式 音频支持的格式为:MP3、M4A、WAV。 音频要求如下所示: 仅提取单声道音频。 音频素材总大小小于500MB。 图片格式 图片支持的格式为:PNG、JPG、JPEG。 图片要求如下所示:
45000003 不支持的视频 用户上传的视频存在问题 检查用户视频完整性,是否存在错误帧等。 400 MSS.45000004 资产类型不支持 资产类型不符合规定 请根据具体描述,判断出用户上传的具体错误文件。 400 MSS.45000005 不支持的图片 用户上传的背景图片不正确
使用数字人形象,设置画布、剧本、互动和开播配置,生成直播视频。 可在合作的第三方平台进行数字人视频直播,如淘宝、拼多多、抖音等。 智能交互 包含下述功能实现场景: 支持开箱即用的智能交互数字人。 支持使用第三方语言模型,自主开发API实现与数字人对话。 支持使用智能交互API或SDK,自主开发实现与数字人对话场景。
可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。 4 视频场景区域 如果一个视频包含多场景,可以新增场景依次制作,顺序播放。
setConfig新增如下参数: enableBusinessTrack:支持关闭SDK埋点。 enableJobCache:支持关闭任务缓存,每次调用create创建都会创建新任务。 useDefaultBackground:支持关闭默认背景图,使用自定义背景图。 主入口(HwICSUiSdk)新增如下接口:
分辨率最大支持1080P。 帧率小于等于30fps。 编码为AV1、H264或H265格式。 AV1、H265编码格式目前支持Chrome浏览器,不支持Edge浏览器。 视频采样格式为YUV420。 视频素材总大小小于1GB。 同时叠加的视频总数量为3,包含互动时配置的视频。 音频格式
Flexus分身数字人目前仅支持视频制作,不支持视频直播和智能交互。 视频制作限制 Flexus数字人采用实景拍摄,视频制作时不支持切换背景。 Flexus分身数字人左上角会有标识。未带有标识的数字人均为标准版形象。 需注意Flexus视频制作和标准版视频制作分开计费,从各自的套餐包中扣除费用。
字,单段落不多于2000字的要求。 段落1.1:大家好,今天欢迎来到会议室,我们今天讨论的主题是:如何更好的学习和工作。 段落1.2:我们每个人都有自己的学习和工作,难免会遇到一些问题。当我们遇到问题的时候,应该如何解决的呢? 图2 文本驱动 文本内容的操作说明如表1所示。 表1
真人正面照,不支持动漫卡通形象;面部占比50%以上,侧脸俯仰角度不超过15度。 五官清晰无遮挡,目视前方。 良好的亮度,确保面部细节。 照片内不能出现多张人脸。 人像照片格式要求,如下所示: 支持的格式为:PNG、JPG、JPEG、WEBP。 大小不超过16MB。 分辨率最大支持1080
FAQ MetaStudio支持哪些区域? 开发者如何获取技术支持? 用户如何举报平台违规内容? 如何调用MetaStudio接口? 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 如何实时切换智能交互的语言和声音? 如何接收并激活声音和分身模型资产?
该声音是否支持SSML的say-as标签。 约束限制: 不涉及 取值范围: true: 支持SSML的say-as标签 false: 不支持SSML的say-as标签 默认取值: false is_support_ssml_sub Boolean 参数解释: 该声音是否支持SSML的sub标签。
表情自然:通过AI眼神矫正,矫正前后眼部ID一致,避免眼神不聚焦。 图像真实:智能重打光,背景融合更真实。 多种复杂场景建模:支持人物走动、侧身等训练,肢体动作更自然。 多语言泛化:一次母语训练,多语种支持;支持20+语种,覆盖主流语言。 相对真人成本下降90%以上 一次拍摄与训练后,可无限次使用;无时间约束
该声音是否支持SSML的say-as标签。 约束限制: 不涉及 取值范围: true: 支持SSML的say-as标签 false: 不支持SSML的say-as标签 默认取值: false is_support_ssml_sub Boolean 参数解释: 该声音是否支持SSML的sub标签。
声音制作限制 声音制作限制说明,如表1所示。 表1 声音制作限制 限制项 说明 用户限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 父主题: 使用限制
功能范围 SP用户仅支持购买大颗粒度资源包,并分配资源给关联租户使用。 SP用户不支持访问MetaStudio控制台,进行控制台操作。 资源使用限制 SP用户购买形象制作时,不会赠送视频制作时长。 如果用户先购买资源,再申请成为SP用户,那么每个形象制作资源赠送的视频制作时长均会被回收,无法再使用。
zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav 支持手机录制20条语料音频
参数解释: 字体。当前支持的字体请参考服务支持的字体 约束限制: 不涉及。 取值范围: 字符长度0-64位 默认取值: HarmonyOS_Sans_SC_Black font_size 否 Integer 参数解释: 字体大小。接口的取值范围为0-120,实际业务使用的取值范围要求为24-120,请以业务实际使用要求为准。
该声音是否支持SSML的say-as标签。 约束限制: 不涉及 取值范围: true: 支持SSML的say-as标签 false: 不支持SSML的say-as标签 默认取值: false is_support_ssml_sub Boolean 参数解释: 该声音是否支持SSML的sub标签。
文本驱动 文本内容的操作说明如表1所示。 表1 操作说明 操作 说明 插入停顿 将鼠标放在需要停顿的文字右侧,单击“插入停顿”。在弹出的提示框中,选择“换气”或者停顿的时间,也支持自定义停顿时长。 连读 选中需要连读的文本内容,单击“连读”。 多音字 选中文本中的多音字,单击“多音