检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
分身数字人X轴位置,即分身数字图片底边中心点像素的X轴的像素值。 横屏(16:9)背景图片像素为1920x1080;竖屏(9:16)背景图片像素为1080x1920。 取值范围: -1920-3840 position_y 否 Integer 分身数字Y轴位置,即分身数字图片底边中心点像素的Y轴的像素值。
100 表10 LayerSizeConfig 参数 是否必选 参数类型 描述 width 否 Integer 参数解释: 图层图片左上角像素点的Y轴位置值图层图片宽度像素值(相对画布大小)。 横屏(16:9)画布像素为1920x1080;竖屏(9:16)画布像素为1080x1920。
参数类型 描述 background_type 是 String 参数解释: 背景类型。 约束限制: 不涉及。 取值范围: IMAGE:图片背景,指定图片用作分身数字人背景。 COLOR:纯色背景,指定颜色RGB值作为分身数字人背景。 默认取值: 不涉及 background_config
参数类型 描述 background_type 是 String 参数解释: 背景类型。 约束限制: 不涉及。 取值范围: IMAGE:图片背景,指定图片用作分身数字人背景。 COLOR:纯色背景,指定颜色RGB值作为分身数字人背景。 默认取值: 不涉及 background_config
提升数字内容生产效率。 算法运行机制 训练阶段: 用户上传一段真人语音音频及授权书作为输入。 音频经过人工安全审核和授权认证后,由训练人员标注用于训练的音频数据,使用深度学习算法训练生成数字人声音模型。 推理阶段: 用户上传一段文本作为输入文本内容,由系统自动审核。 输入文本使用数字人声音模型推理生成数字人语音。
默认取值: 100 表13 LayerSizeConfig 参数 参数类型 描述 width Integer 参数解释: 图层图片左上角像素点的Y轴位置值图层图片宽度像素值(相对画布大小)。 横屏(16:9)画布像素为1920x1080;竖屏(9:16)画布像素为1080x1920。
资产ID asset_type String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频 order Integer 参数解释: 资产次序。不设置或者0表示按照加入时间先后排序。业务上将次序最靠前的图片设置为商品封面。 取值范围: 0-300 默认取值: 0 asset_name
100 表10 LayerSizeConfig 参数 是否必选 参数类型 描述 width 否 Integer 参数解释: 图层图片左上角像素点的Y轴位置值图层图片宽度像素值(相对画布大小)。 横屏(16:9)画布像素为1920x1080;竖屏(9:16)画布像素为1080x1920。
asset_type 否 String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频 order 否 Integer 参数解释: 资产次序。不设置或者0表示按照加入时间先后排序。业务上将次序最靠前的图片设置为商品封面。 取值范围: 0-300 默认取值: 0 响应参数
asset_type 否 String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频 order 否 Integer 参数解释: 资产次序。不设置或者0表示按照加入时间先后排序。业务上将次序最靠前的图片设置为商品封面。 取值范围: 0-300 默认取值: 0 响应参数
播、智能交互等服务,使能千行百业场景应用。 产品介绍 视频论坛 立即使用 立即使用 成长地图 由浅入深,带您玩转MetaStudio 弹性云服务器四 01 了解 了解数字内容生产线的工作原理、功能详情、应用场景等,帮助您快速找到与业务适配的功能。 产品介绍 什么是数字内容生产线 功能特性
获取训练视频已上传分片信息 CONFIRM_REPAIR:用户发起优化模型请求 CONFIRM_MULTIPART_UPLOADED:确认训练视频所有分片文件已上传 GET_ACTION_VIDEO_MULTIPART_UPLOADED:获取动作编排视频分片上传地址 CONFI
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。
资产ID asset_type String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频 order Integer 参数解释: 资产次序。不设置或者0表示按照加入时间先后排序。业务上将次序最靠前的图片设置为商品封面。 取值范围: 0-300 默认取值: 0 asset_name
3D数字人风格化照片建模 创建照片建模任务 照片建模任务列表查询 照片建模任务详情查询 基于图片URL创建照片建模任务 创建照片建模任务 父主题: 3D数字人
参数类型 描述 background_type 是 String 参数解释: 背景类型。 约束限制: 不涉及。 取值范围: IMAGE:图片背景,指定图片用作分身数字人背景。 COLOR:纯色背景,指定颜色RGB值作为分身数字人背景。 默认取值: 不涉及 background_config
用使用麦克风之后,将您的音频数据或文本数据上传到客户指定的第三方系统或模型,用于识别语义并做出应答,给您提供交互功能。 产品运营和维护 为了保障SDK稳定运行,改善产品的运营策略,SDK会直接收集客户应用调用SDK接口的信息并上传至服务器进行统计分析。处理的个人信息包括应用信息(浏览器User
20次/秒 10次/秒 10次/秒 复制资产 4次/秒 3次/秒 3次/秒 文件管理 创建文件并获取上传URL 10次/秒 5次/秒 5次/秒 删除文件 10次/秒 5次/秒 5次/秒 确认文件已上传 10次/秒 5次/秒 5次/秒 创建大文件 10次/秒 5次/秒 5次/秒 视频制作剧本管理
pre_beauty_image_download_url String 美白前图片下载url。 action_video_download_url String 动作视频 post_beauty_image_download_url String 美白后图片下载url。 audio_file_download_url
解决部分BUG,优化部分错误提示。 2024-05-06 本次变更如下: 新增发布2.0.1版本SDK,相比2.0.0版本,变更点如下所示: 字幕支持回显富文本(目前支持图片、视频单个回显)。 新增接口startSpeak,stopSpeak,muteRemoteAudio,unmuteRemoteAudio。