检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
贴图支持动态图片吗? 不支持。目前仅支持上传PNG、JPG、JPEG和BMP格式的图片文件,不支持GIF等动态图片格式。 父主题: 视频制作
基于图片URL创建照片建模任务 功能介绍 该接口用于从URL中获取图片进行照片建模任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human/stylized/picture-modelings-by-url 表1 路径参数
上传图片时提示像素超标怎么办? 图片像素不是文件大小,如果用户仅修改图片大小,控制台还会继续提示像素超标。 上传图片的长宽需要至少满足下述一个条件: (width <= 2160) & (height <= 3840) (width <= 3840) &(height <= 2160)
创建智能交互数字人(华为云CBS) 配置对话机器人服务CBS 创建智能交互数字人 父主题: 智能交互
稿一:华为云MetaStudio介绍 基于盘古数字人大模型,华为云MetaStudio打造了一站式、全流程的数字人直播服务,通过高效的训练和推理服务,重塑千行百业的电商直播。 数字人模型生成和驱动:基于一张照片或者一段3-5分钟视频,可以生成分身数字人模型,生成效率相比业界提升3
否通过安全筛选,若不通过则不进行数据生成和结果返回操作。 将视频图片输入至算法模型中,将视频图像分割为面部、手部和身体三个区域。 使用深度学习算法,识别面部区域转化为面部表情,识别手部区域转化为手部骨骼驱动数据,识别身体转化为人体骨骼驱动数据。 对算法输出系数进行平滑处理及异常数据过滤,返回结果。
3D数字人风格化照片建模 创建照片建模任务 照片建模任务列表查询 照片建模任务详情查询 基于图片URL创建照片建模任务 父主题: 3D数字人
客户声音制作案例 单击声音样例.zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav
常见问题 智能交互SDK安装包里为什么有图片资源? SDK里面包含图片资源,是因为智能交互的动效、背景可能需要图片资源才能展示更好的效果。所以智能交互Web SDK为了方便用户集成使用,会同时包含UI相关资源。 speechRecognized和semanticRecognized通知的流式返回有什么差异?
视频制作 上传图片时提示像素超标怎么办? 贴图支持动态图片吗? PPT如何转为PDF文件? 如何呈现PPT的动画效果? PPT文件解析失败,无法上传怎么办? 上传的PPT支持编辑吗? 视频合成失败如何处理? 如何将WEBM视频转成MOV格式? 合成的视频可以下载至本地吗? 合成视频二次剪辑后,数字人口型效果变差?
场景、图片和音乐资产。 图2 上传资产 单击“图片”,进入“图片上传”页面,如图3所示。 请根据实际情况,配置下述信息: 资产标题:图片的标题。 图片简介:图片的基本介绍,方便了解和使用。 风格:关键词标签,方便用户搜索此类型的资产。 基本信息:图片的用途。 图3 上传图片 单击
分身数字人定制任务提交后,审核未通过怎么办? 如果提示信息为“自动审核不通过-人证不匹配”,可能原因如下所示: 人证校验时识别不到人脸,确保身份证照片无反光导致的内容或人像不清晰。 确保视频中的人脸清晰且与提交身份证中的人像保持一致。 视频方向可能不对,竖屏横拍的素材需要旋转,确保被拍摄对象为竖向。
查看界面右侧的“互动问答”页签,如图1所示。 参数配置说明如表1所示。 图1 创建应用 表1 创建应用 参数 说明 第三方应用 从下拉框中选择“华为云CBS”。 需已完成配置对话机器人服务CBS。 应用名称 用户根据实际情况自定义即可。 问答机器人ID 输入问答机器人ID。可在CBS控
以自定义颜色。 筛选条件 支持通过背景、类型的维度,筛选展示下方的图片。 图片列表 默认展示全量图片。选中场景,单击图片,可以替换当前场景的背景。 将鼠标放在图片上方,图片右上角展示图标。单击图标,可以将当前图片作为背景替换至所有场景。 PPT PPT界面详情,如图3所示。 上传
该接口用于在资产库中添加上传新的媒体资产。可上传的资产类型包括:分身数字人模型、背景图片、素材图片、素材视频、PPT等。 资产类型是IMAGE时,通过system_properties来区分背景图片(BACKGROUND_IMG)、素材图片(MATERIAL_IMG)。 资产类型是VIDEO时,通过s
上传后的背景图片不支持修改。如需修改图片内容,需本地修改完成后,再上传至控制台使用。 图2 背景界面 背景界面说明,如表2所示。 表2 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择PNG、JPG、JPEG和BMP格式的图片上传。也可直接将图片拖拽至图片列表区域。
格式的富媒体: 图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体,示例如表1所示。以奇妙问知识库为例,可以通过新增知识库来补充富媒体知识。 如果使用服务提供SDK默认样式,受限于浏览器的CSP策略,导入图片、视频链接的域名,需提交工单添加至白名单。
也支持直接拖拽本地图片至图片列表区域,完成上传操作。 界面默认展示两列图片,单击图标后,缩小展示为1列图片。单击图标,可恢复为2列展示。 关键词搜索框,可输入图片名称进行精准搜索。 示例:科技。 筛选条件 支持通过背景、风格和布局的维度,筛选展示下方的图片。 图片列表 默认展示全量图片。选中
SDK隐私声明 数字人智能交互Web SDK是由华为云计算技术有限公司(以下简称“我们”或“华为云”)面向华为云客户(以下简称“客户”)提供的数字人智能交互开放能力及服务。 客户根据数字人智能交互Web SDK的开发文档和指南在其应用中集成了数字人智能交互Web SDK后,我们将通过被集成的数字人智能交互Web
自动驾驶具备安全合规、数据管理高效、算法训练高效、生态开放等优势。 华为云|自动驾驶 图3 技能编辑页面 表3 问答对 参数 说明 主题 输入主题,便于问题查找,不包含问题内容。 所有问法 输入所有提问方式。问法包括同一个问题的不同提问方式。 支持最多添加500个相似问题,每个问题不能超过64个字符。 数字人回答