检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
3D数字人风格化照片建模 创建照片建模任务 照片建模任务列表查询 照片建模任务详情查询 基于图片URL创建照片建模任务 父主题: 3D数字人
形象。 用户自定义的Flexus分身数字人,也会展示在这里。Flexus分身数字人左上角会有标识。 背景:背景图片列表,可本地导入图片。支持透明背景、纯色背景或导入图片。 PPT:PPT文件列表,需要用户从本地导入后使用。 贴图:各类贴图列表,可本地导入素材。支持在当前画面基础上,增加贴图,丰富视频画面。
le_md5的值一致。 Content-Type常见取值,如下所示: image/gif:gif图片格式 image/jpeg:jpg或jpeg图片格式 image/png:png图片格式 audio/mp3:mp3音频格式 audio/wav:wav音频格式 video/mp4:mp4视频格式
ID,查询资产信息。 重命名资产 单击资产卡片区域的图标,从下拉框中单击“重命名”,对资产进行重命名。 取消激活 单击资产卡片区域的“取消激活”,将资产设置为“未激活”状态。未激活状态的资产在控制台不可用。 查看详情 单击资产卡片,进入资产详情界面,查看资产的全部信息,图片资产详情示例如图2所示。
BACKGROUND_IMG:视频制作的背景图片。value设置成Yes CREATED_BY_PLATFORM: 是否平台生成。 分身数字人资产属性: MATERIAL_IMG:素材图片,用作图片图层。value设置成Yes,否则控制台视频制作、直播等界面的贴图区域,将无法看到此图片。 MATERIAL
回复问题的时候,支持同时在直播画面中展示图片或者视频信息,以加强回复效果。图片和视频的添加和设置方式完全相同,下面以图片为例,进行操作说明。 单击下方的“+”区域框,从本地选择图片或视频,添加到“+”区域框中。 添加成功后,区域框展示图片缩略图,如所示。 将鼠标放在区域框中,区域框变化为形式。
合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作: 单击商品所在行的“查看”,进入商品详情界面,支持单击“编辑”,修改商品信息。
智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 素材绑定(可选) 从本地选择图片或视频上传。当直播间命中当前互动内容进行答复时,同时会在直播画面展示这里上传的图片或视频。 单击“保存”,一条互动规则新增完成。 用户可以根据实际情况,为当前互动库增加更多的互动规则,或者增加更多的互动库。
创建技能 表1 创建技能 参数 说明 技能名称 技能名称,必须与科大讯飞创建的技能一一对应,如在科大讯飞创建同名技能并导入技能文件所示。 为方便识别和记忆,两边的技能名称推荐相同。 技能标识 技能标识,必须与科大讯飞创建的技能标识保持一致,如在科大讯飞创建同名技能并导入技能文件所示。否
资产被冻结,资产不可用,不可查看文件。 WAITING_DELETE:资产将被下线 asset_type String 资产类型。 公共资产类型: VOICE_MODEL:音色模型(仅系统管理员可上传,普通租户仅可查询) VIDEO:视频文件 IMAGE:图片文件 PPT:幻灯片文件
合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作: 单击商品所在行的“查看”,进入商品详情界面,支持单击“编辑”,修改商品信息。
分身数字人定制任务提交后,审核未通过怎么办? 如果提示信息为“自动审核不通过-人证不匹配”,可能原因如下所示: 人证校验时识别不到人脸,确保身份证照片无反光导致的内容或人像不清晰。 确保视频中的人脸清晰且与提交身份证中的人像保持一致。 视频方向可能不对,竖屏横拍的素材需要旋转,确保被拍摄对象为竖向。
ms,会结束语音识别。建议该值大于500ms。 委托语言交互服务(SIS) 如需使用热词功能,请开启委托授权。SIS服务用于将用户口述音频转换为文本。 热词 仅开启“委托语言交互服务(SIS)”后,才会展示“热词”配置。 数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,
解决部分BUG,优化部分错误提示。 2024-05-06 本次变更如下: 新增发布2.0.1版本SDK,相比2.0.0版本,变更点如下所示: 字幕支持回显富文本(目前支持图片、视频单个回显)。 新增接口startSpeak,stopSpeak,muteRemoteAudio,unmuteRemoteAudio。
示。 声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。
ms,会结束语音识别。建议该值大于500ms。 委托语言交互服务(SIS) 如需使用热词功能,请开启委托授权。SIS服务用于将用户口述音频转换为文本。 热词 仅开启“委托语言交互服务(SIS)”后,才会展示“热词”配置。 数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,
服务处理。 详细操作如下所示: 访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。 服务会在收到问题单后,联系您处理。
种功能,如查询信息、播放音乐、设定提醒等。 163. 家用机器人还具备语音识别和语音回应功能,让您能够与机器人进行流畅的对话和交流。 164. 视觉交互:家用机器人配备了先进的摄像头和视觉传感器,可以通过图像识别和视觉感知与您进行交互。 165. 例如,机器人可以识别家庭成员的面
fo 参数 类型 描述 text string 识别结果文本。 questionText string 问题文本。 resultId number 识别流式响应时返回的各包顺序序号。 isLast boolean 是否是最后一条识别结果。 chatId string 对话ID,每轮问答的ID值唯一。
表1 资产存储计费说明 资产存储 计费说明 免费存储空间 MetaStudio服务免费赠送每个租户5GB资产存储空间,用于上传各类音视频、图片等素材。如果租户需要更多的存储空间,请购买单独的资产管理包月产品。 定制形象模型存储 基于MetaStudio服务定制生成的形象模型,其所