检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
右侧界面的预览效果就是数字人名片的实际生成效果,请输入适量的字符,以确保正常的展示效果。 公司 必填项,数字人公司。 内容较多时,最多支持在名片中分2行展示,超出2行后,默认不展示。为保证名片的效果展示,请保持合理的输入长度。 联系电话 必填项,数字人联系电话,请输入有效的联系方式。 公司地址
获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。
出门问问账户余额不足,请更换其他音色或联系技术支持。 MSS.47000001 ERROR 请联系技术支持 MSS.47000002 infer service error:{0} 请联系技术支持 MSS.47000003 Failed to prepare the task: {0} 请联系技术支持 MSS.47000004
e浏览器,不支持Edge浏览器。 视频素材总大小小于1GB。 同时叠加的视频总数量最多支持2个。 音频格式 音频支持的格式为:MP3、M4A、WAV。 音频要求如下所示: 仅提取单声道音频。 音频素材总大小小于500MB。 图片格式 图片支持的格式为:PNG、JPG、JPEG。 图片要求如下所示:
45000003 不支持的视频 用户上传的视频存在问题 检查用户视频完整性,是否存在错误帧等。 400 MSS.45000004 资产类型不支持 资产类型不符合规定 请根据具体描述,判断出用户上传的具体错误文件。 400 MSS.45000005 不支持的图片 用户上传的背景图片不正确
对接第三方大脑,通过数字人交互的方式与用户进行问答。场景应用广泛,包括智能导购、文旅导览、智能问答、营业厅客服等。 注意: 数字人回答的内容,是由对接的第三方大模型或知识库返回的答案决定的。 资产管理 支持从本地上传模型、PPT、动画、素材、视频、场景、图片、音乐等资产。 支持转移声音和模型资产给其他租户使用。
可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。 4 视频场景区域 如果一个视频包含多场景,可以新增场景依次制作,顺序播放。
setConfig新增如下参数: enableBusinessTrack:支持关闭SDK埋点。 enableJobCache:支持关闭任务缓存,每次调用create创建都会创建新任务。 useDefaultBackground:支持关闭默认背景图,使用自定义背景图。 主入口(HwICSUiSdk)新增如下接口:
Flexus分身数字人目前仅支持视频制作,不支持视频直播和智能交互。 视频制作限制 Flexus数字人采用实景拍摄,视频制作时不支持切换背景。 Flexus分身数字人左上角会有标识。未带有标识的数字人均为标准版形象。 需注意Flexus视频制作和标准版视频制作分开计费,从各自的套餐包中扣除费用。
该声音是否支持SSML的say-as标签。 约束限制: 不涉及 取值范围: true: 支持SSML的say-as标签 false: 不支持SSML的say-as标签 默认取值: false is_support_ssml_sub 否 Boolean 参数解释: 该声音是否支持SSML的sub标签。
分辨率最大支持1080P。 帧率小于等于30fps。 编码为AV1、H264或H265格式。 AV1、H265编码格式目前支持Chrome浏览器,不支持Edge浏览器。 视频采样格式为YUV420。 视频素材总大小小于1GB。 同时叠加的视频总数量为3,包含互动时配置的视频。 音频格式
真人正面照,不支持动漫卡通形象;面部占比50%以上,侧脸俯仰角度不超过15度。 五官清晰无遮挡,目视前方。 良好的亮度,确保面部细节。 照片内不能出现多张人脸。 人像照片格式要求,如下所示: 支持的格式为:PNG、JPG、JPEG、WEBP。 大小不超过16MB。 分辨率最大支持1080
字,单段落不多于2000字的要求。 段落1.1:大家好,今天欢迎来到会议室,我们今天讨论的主题是:如何更好的学习和工作。 段落1.2:我们每个人都有自己的学习和工作,难免会遇到一些问题。当我们遇到问题的时候,应该如何解决的呢? 图2 文本驱动 文本内容的操作说明如表1所示。 表1
表情自然:AI眼神纠正,持续眼神交流,细节更丰富。 图像真实:智能重打光,背景融合更真实。 多种复杂场景建模:支持人物走动、侧身等训练,肢体动作更自然。 多语言泛化:一次母语训练,多语种支持;支持20+语种,覆盖主流语言。 相对真人成本下降90%以上 一次拍摄与训练后,可无限次使用;无时间约束
FAQ MetaStudio支持哪些区域? 开发者如何获取技术支持? 用户如何举报平台违规内容? 如何调用MetaStudio接口? 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 如何实时切换智能交互的语言和声音? 父主题: 附录
声音制作限制 声音制作限制说明,如表1所示。 表1 声音制作限制 限制项 说明 用户限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 父主题: 使用限制
zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav 支持手机录制20条语料音频
该声音是否支持SSML的say-as标签。 约束限制: 不涉及 取值范围: true: 支持SSML的say-as标签 false: 不支持SSML的say-as标签 默认取值: false is_support_ssml_sub Boolean 参数解释: 该声音是否支持SSML的sub标签。
形象制作限制 形象制作限制说明,如表1所示。 表1 形象制作限制 限制项 说明 用户限制 MetaStudio不支持个人用户定制形象,仅支持企业用户。 定制分身形象时,从平台下载的授权书中有明确说明,定制分身形象需授权给公司使用。 父主题: 使用限制
该声音是否支持SSML的say-as标签。 约束限制: 不涉及 取值范围: true: 支持SSML的say-as标签 false: 不支持SSML的say-as标签 默认取值: false is_support_ssml_sub Boolean 参数解释: 该声音是否支持SSML的sub标签。