检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
参数类型 描述 background_type 是 String 参数解释: 背景类型。 约束限制: 不涉及。 取值范围: IMAGE:图片背景,指定图片用作分身数字人背景。 COLOR:纯色背景,指定颜色RGB值作为分身数字人背景。 默认取值: 不涉及 background_config
解决部分BUG,优化部分错误提示。 2024-05-06 本次变更如下: 新增发布2.0.1版本SDK,相比2.0.0版本,变更点如下所示: 字幕支持回显富文本(目前支持图片、视频单个回显)。 新增接口startSpeak,stopSpeak,muteRemoteAudio,unmuteRemoteAudio。
参数类型 描述 background_type 是 String 参数解释: 背景类型。 约束限制: 不涉及。 取值范围: IMAGE:图片背景,指定图片用作分身数字人背景。 COLOR:纯色背景,指定颜色RGB值作为分身数字人背景。 默认取值: 不涉及 background_config
资产ID asset_type String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频 order Integer 参数解释: 资产次序。不设置或者0表示按照加入时间先后排序。业务上将次序最靠前的图片设置为商品封面。 取值范围: 0-300 默认取值: 0 asset_name
参数类型 描述 background_type 是 String 参数解释: 背景类型。 约束限制: 不涉及。 取值范围: IMAGE:图片背景,指定图片用作分身数字人背景。 COLOR:纯色背景,指定颜色RGB值作为分身数字人背景。 默认取值: 不涉及 background_config
商品类别。设置以后,自动成为商品的标签,方便搜索商品。 支持多选,支持添加新类别。 产品素材 合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。
选择“文本回复”,输入文本内容,当满足触发方式时,数字人会阅读文本内容。 素材绑定(可选) 从本地选择图片或视频上传。当直播间命中当前互动内容进行答复时,同时会在直播画面展示这里上传的图片或视频。 无需设置。 单击“保存”,一条互动规则新增完成。 用户可以根据实际情况,为当前互动库增加更多的互动规则,或者增加更多的互动库。
动画生成效率,提升虚拟人控制体验。 算法运行机制 输入为单人表演视频。 通过视频抽帧得到单张图片。经过安全过滤,判断是否通过安全筛选,若不通过则不进行数据生成和结果返回操作。 将视频图片输入至算法模型中,将视频图像分割为面部、手部和身体三个区域。 使用深度学习算法,识别面部区域转
表1 资产存储计费说明 资产存储 计费说明 免费存储空间 MetaStudio服务免费赠送每个租户5GB资产存储空间,用于上传各类音视频、图片等素材。如果租户需要更多的存储空间,请购买单独的资产管理包月产品。 定制形象模型存储 基于MetaStudio服务定制生成的形象模型,其所
无论是行走、搬运物品还是执行其他动作,机器人都能轻松应对。 这款家用机器人还采用了超高清显示技术,带给您细腻的色彩和清晰度。 无论是在观看电影、浏览图片还是玩游戏时,您都可以享受到极致的视觉体验。 它将为您的生活带来更多便捷和乐趣,让您轻松畅享美好时光! 为了感谢广大消费者,品牌现在特别推出限时优惠活动!
文件。 声音授权 单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。 授权书内容,可参考授权书。 单击“提交制作”。 弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。
asset_type 否 String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频 order 否 Integer 参数解释: 资产次序。不设置或者0表示按照加入时间先后排序。业务上将次序最靠前的图片设置为商品封面。 取值范围: 0-300 默认取值: 0 响应参数
asset_type 否 String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频 order 否 Integer 参数解释: 资产次序。不设置或者0表示按照加入时间先后排序。业务上将次序最靠前的图片设置为商品封面。 取值范围: 0-300 默认取值: 0 响应参数
获取语音训练任务审核结果 20次/秒 10次/秒 10次/秒 设置任务批次 10次/秒 3次/秒 3次/秒 确认在线录音结果 10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件
素材操作详情。 模板:视频直播模板,“模板”页签仅管理员可见。 角色:数字人形象列表,可选择需要使用的数字人形象,支持自定义。 背景:背景图片列表,支持本地导入。可选择需要使用的背景图。 贴图:各类贴图列表,支持本地导入。支持在当前画面基础上,增加贴图,丰富视频画面。 视频:无声
提交语音训练任务 查询语音训练任务详情 删除语音训练任务 查询任务操作日志 获取语音文件上传地址 获取语音训练任务审核结果 设置任务批次 确认在线录音结果 获取在线录音确认结果
第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 picture_base64 是 String 图片BASE64编码后内容 style_id 是 String 风格ID name 是 String 模型名称 notify_url 否 String
场景。 声音授权 单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。 授权书内容,可参考授权书。 单击“提交制作”。 弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。
String 资产类型。 公共资产类型: VOICE_MODEL:音色模型(仅系统管理员可上传,普通租户仅可查询) VIDEO:视频文件 IMAGE:图片文件 PPT:幻灯片文件 MUSIC: 音乐 AUDIO: 音频 COMMON_FILE:通用文件 分身数字人资产: HUMAN_MODEL_2D:
asset_type 否 String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频 order 否 Integer 参数解释: 资产次序。不设置或者0表示按照加入时间先后排序。业务上将次序最靠前的图片设置为商品封面。 取值范围: 0-300 默认取值: 0 表5