检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基于图片URL创建照片建模任务 功能介绍 该接口用于从URL中获取图片进行照片建模任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human/stylized/picture-modelings-by-url 表1 路径参数
常见问题 智能交互SDK安装包里为什么有图片资源? SDK里面包含图片资源,是因为智能交互的动效、背景可能需要图片资源才能展示更好的效果。所以智能交互Web SDK为了方便用户集成使用,会同时包含UI相关资源。 speechRecognized和semanticRecognized通知的流式返回有什么差异?
场景、图片和音乐资产。 图2 上传资产 单击“图片”,进入“图片上传”页面,如图3所示。 请根据实际情况,配置下述信息: 资产标题:图片的标题。 图片简介:图片的基本介绍,方便了解和使用。 风格:关键词标签,方便用户搜索此类型的资产。 基本信息:图片的用途。 图3 上传图片 单击
该接口用于在资产库中添加上传新的媒体资产。可上传的资产类型包括:分身数字人模型、背景图片、素材图片、素材视频、PPT等。 资产类型是IMAGE时,通过system_properties来区分背景图片(BACKGROUND_IMG)、素材图片(MATERIAL_IMG)。 资产类型是VIDEO时,通过s
下格式的富媒体: 图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体。以奇妙问知识库为例,参考新增知识库,补充富媒体知识,示例如表1所示。 如果使用服务提供SDK默认样式,受限于浏览器的CSP策略,导入图片、视频链接的域名,需提交工单添加至白名单。
、JPEG和BMP格式的图片上传。 也支持直接拖拽本地图片至图片列表区域,完成上传操作。 关键词搜索框,可输入图片名称进行精准搜索。 示例:科技。 筛选条件 支持通过背景图片来源的维度,筛选展示下方的图片。 图片列表 默认展示全量图片。选中场景,单击图片,可以替换当前场景的背景。
单击“本地导入”,从本地选择PNG、JPG和JPEG格式的图片上传。暂不支持4K以上的图片。 也支持直接拖拽本地图片至图片列表区域,完成上传操作。 界面默认展示两列图片,单击图标后,缩小展示为1列图片。单击图标,可恢复为2列展示。 关键词搜索框,可输入图片名称进行精准搜索。 示例:科技。 筛选条件
需提前准备一张正面清晰且无遮挡的数字人形象照片,并满足如下要求: 图片格式:png、jpg、jpeg、webp。 单击“查看示范”,查看正确示范和错误示范。 界面操作如下所示: 单击“头像区域”,从本地选择分身数字人头像图片。 在弹出的“头像调整”对话框中,可以调整图片大小和图片位置。 单击“确认”,头像上传完成。
BACKGROUND_IMG:视频制作的背景图片。value设置成Yes CREATED_BY_PLATFORM: 是否平台生成。 分身数字人资产属性: MATERIAL_IMG:素材图片,用作图片图层。value设置成Yes,否则控制台视频制作、直播等界面的贴图区域,将无法看到此图片。 MATERIAL
以自定义颜色。 筛选条件 支持通过背景、类型的维度,筛选展示下方的图片。 图片列表 默认展示全量图片。选中场景,单击图片,可以替换当前场景的背景。 将鼠标放在图片上方,图片右上角展示图标。单击图标,可以将当前图片作为背景替换至所有场景。 PPT PPT界面详情,如图3所示。 图3
BACKGROUND_IMG:视频制作的背景图片。value设置成Yes CREATED_BY_PLATFORM: 是否平台生成。 分身数字人资产属性: MATERIAL_IMG:素材图片,用作图片图层。value设置成Yes,否则控制台视频制作、直播等界面的贴图区域,将无法看到此图片。 MATERIAL
45000012 图片数量超限 用户上传前景图片数量超过限制,目前是100张 要求用户减少图片数量 400 MSS.45000013 图片格式错误 用户上传的图片格式不支持 要求用户修改图片格式 400 MSS.45000014 图片解析失败 用户上传前景图片中有无法解析的图片 要求用户替换有问题的图片
否通过安全筛选,若不通过则不进行数据生成和结果返回操作。 将视频图片输入至算法模型中,将视频图像分割为面部、手部和身体三个区域。 使用深度学习算法,识别面部区域转化为面部表情,识别手部区域转化为手部骨骼驱动数据,识别身体转化为人体骨骼驱动数据。 对算法输出系数进行平滑处理及异常数据过滤,返回结果。
分身数字人X轴位置,即分身数字图片底边中心点像素的X轴的像素值。 横屏(16:9)背景图片像素为1920x1080;竖屏(9:16)背景图片像素为1080x1920。 取值范围: -1920-3840 position_y Integer 分身数字Y轴位置,即分身数字图片底边中心点像素的Y轴的像素值。
BACKGROUND_IMG:视频制作的背景图片。value设置成Yes CREATED_BY_PLATFORM: 是否平台生成。 分身数字人资产属性: MATERIAL_IMG:素材图片,用作图片图层。value设置成Yes,否则控制台视频制作、直播等界面的贴图区域,将无法看到此图片。 MATERIAL
音频支持的格式为:MP3、M4A、WAV。 音频要求如下所示: 仅提取单声道音频。 音频素材总大小小于500MB。 图片格式 图片支持的格式为:PNG、JPG、JPEG。 图片要求如下所示: 分辨率最大支持1080P。 图片素材总大小小于500MB。 字幕 字幕中正常断句的符号,如中文符号、,。:;!?…..
音频支持的格式为:MP3、M4A、WAV。 音频要求如下所示: 仅提取单声道音频。 音频素材总大小小于500MB。 图片格式 图片支持的格式为:PNG、JPG、JPEG。 图片要求如下所示: 分辨率最大支持1080P。 图片素材总大小小于500MB。 字幕 字幕中正常断句的符号,如中文符号、,。:;!?…..
分身数字人X轴位置,即分身数字图片底边中心点像素的X轴的像素值。 横屏(16:9)背景图片像素为1920x1080;竖屏(9:16)背景图片像素为1080x1920。 取值范围: -1920-3840 position_y 否 Integer 分身数字Y轴位置,即分身数字图片底边中心点像素的Y轴的像素值。
分身数字人X轴位置,即分身数字图片底边中心点像素的X轴的像素值。 横屏(16:9)背景图片像素为1920x1080;竖屏(9:16)背景图片像素为1080x1920。 取值范围: -1920-3840 position_y Integer 分身数字Y轴位置,即分身数字图片底边中心点像素的Y轴的像素值。
形象。 用户自定义的Flexus分身数字人,也会展示在这里。Flexus分身数字人左上角会有标识。 背景:背景图片列表,可本地导入图片。支持透明背景、纯色背景或导入图片。 PPT:PPT文件列表,需要用户从本地导入后使用。 贴图:各类贴图列表,可本地导入素材。支持在当前画面基础上,增加贴图,丰富视频画面。