检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
音频格式支持WAV、MP3,单段音频时长1~5分钟,建议1分钟。语料中的语言仅支持中文和英文。 视频中提取声音:直接提取训练视频中的声音,训练生成Flexus声音。 视频中的语言仅支持中文和英文。 须知:“单独上传语料包”的方式生成Flexus声音的效果会更好。 数字人名称 生成的Flexus数字人名称。
预付费资源包中扣除1次。 计费时优先使用套餐包中的额度,该额度使用完后,转按需付费。 照片建模的含义:根据单张照片自动生成3D风格化基础模型。 按需计费 按需预付费套餐包 语音驱动 按照输入文本或语音驱动数字人口型、表情等动作的时长进行计费。 计费时优先使用套餐包中的额度,该额度使用完后,转按需付费。
待上传文件 系统审核中 AUTO_VERIFYING: 自动审核中 MANUAL_VERIFYING: 人工审核中 系统审核未通过 AUTO_VERIFY_FAILED: 自动审核失败 MANUAL_VERIFY_FAILED: 人工审核失败 算法训练中 说明: 算法训练中的状态仅管理员
应用领域:分身数字人驱动算法可以应用于真人视频自动生成,包括新闻播报,课件制作等场景,以取代真人视频拍摄,提升视频内容生产效率。 算法运行机制 选择一段真人视频。 输入真人视频,经过平台专家安全审核通过,且用户授权使用后,由训练人员选取真人视频中符合要求的视频进行预处理。预处理完成后,
终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,MetaStudio的终端节点如表1所示。您也可以从地区和终端节点中查询服务的终端节点。 表1 MetaStudio的终端节点 区域名称 区域 终端节点(Endpoint) 华东-上海一 cn-east-3 metastudio.cn-east-3
单击“选择webm文件”,选择WEBM格式的视频。 等待视频格式转换完成。请注意,视频格式转换过程中,一定不能关闭如图2所示的2个窗口。 图2 工具运行界面 视频转换过程中,工具的同级目录下面会出现一些过程文件,请勿移动或删除,待视频格式转换完成后,会自动删除。 图3 工具目录 视频格式转换完成后,WEBM视频文件的
在智能交互编辑页面,依次设置角色和背景。 单击左侧导航栏中的“应用”,如图2所示,请参考表1进行配置。 配置完成后,还需执行下述操作,对应的操作流程图,如图3所示。 下载并集成智能交互Web SDK,操作请参考智能交互SDK。 在Web SDK的create接口入参eventListeners中,监听jobInfo
选择当前租户使用已分配资源的有效截止日期,超出此日期后,资源自动释放回资源包中。SP用户可再次分配给租户使用。 单击“确定”。在“租户列表”页面,查看分配效果,如图4所示。 以506租户的“分身形象制作(个)”列为例,“5 / 5”中第一个5说明当前资源实例分配了5个分身形象制作资源给当
人像照片格式要求,如下所示: 支持的格式为:PNG、JPG、JPEG、WEBP。 大小不超过16MB。 分辨率最大支持1080P,如果超出,会自动缩放为1080P,且需保证分辨率大于等于80*80。 音频 音频录制要求,如下所示: 单声道音频。 清晰人声无背景音乐与杂音。 音频格式要求,如下所示:
携带1个最新问题,和历史最新的2个问题,共计3个问题。其他数值的配置效果,以此类推。 对话内容合规审核 开启后,将自动审核用户的提问内容,若问题存在违禁词,系统将自动拦截返回默认答案。如果关闭,将无法审核用户提问是否合规。 单击“确定”,智能交互应用创建完成。 父主题: 视频直播
is_need_generate_cover 否 Boolean 参数解释: 是否需要生成封面。 约束限制: 仅用于视频类资产。 取值范围: true:自动生成封面。 false:不自动生成封面。 默认取值: false asset_order 否 Integer 参数解释: 用于console控制台展示顺序。
筛选条件 支持通过角色、性别、姿势、行业、区域和分辨率的维度,筛选展示下方的数字人。 数字人列表 默认展示全量数字人。单击数字人形象,自动替换至智能交互预览界面中。 背景 背景界面详情,如图2所示。 图2 背景界面 背景界面说明,如表2所示。 表2 界面元素说明 界面元素 说明 本地导入
删除资产 功能介绍 该接口用于删除资产库中的媒体资产。调用该接口删除媒体资产时,媒体资产会放入回收站中,不会彻底删除。如需彻底删除资产,需增加“mode=force”参数配置。 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/digital-assets/{asset_id}
用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。 确认声音制作任务已训练完成后,在左侧导航栏中,单击“我的创作”。 选择“声音”,找到已生成的声音,单击声音卡片中的头像,即可试听声音效果。
详见表5中,支持隐藏SDK弱提示,比如SDK内部websocket异常提示。 2024-04-02 本次变更如下: 新增发布1.1.2版本SDK,相比1.1.1版本,修复如下问题: SDK不再设置document.title,避免影响网页title。 支持替换加载中背景图,图片所在路径为
获取TTS试听文件 功能介绍 该接口用于获取TTS试听文件下载链接,返回List中包含当前已生产的试听文件。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/ttsc/audition-file/{job_id} 表1 路径参数 参数 是否必选
互动名称(可选) 互动名称。 触发方式 触发关键词,多个关键词用“|”分隔,示例“链接|型号|优惠”。 服务扫描弹幕的时候,如果扫描到此关键词,自动回复当前互动内容。 回复方式 选择主播或助播进行回复,具体回复内容支持通过下述方式设置。 文本:通过文本方式设置回复内容,最多可增加5条回
这使得机器人在家庭环境中自主导航并避开障碍物成为可能。 49. 通过这种方式,机器人不会碰到家具或其他障碍物,也不会误入不该进入的区域,从而避免了可能的损坏。 50. 此外,智能机器人还具有自动充电功能。 51. 当电量低时,它可以自动返回到充电站并自动启动充电。 52. 这使
TEMP:临时直播间,直播任务结束后自动清理直播间。 TEMPLATE:直播间模板。 默认取值: NORMAL room_state String 直播间配置状态。 ENABLE: 直播间正常可用。 DISABLE: 直播间不可用。不可用原因在error_info中说明。 BLOCKED:直
图片元数据 video_meta VideoAssetMeta object 视频元数据,自动提取获得。 audio_meta AudioAssetMeta object 音频元数据,自动提取获得。 表6 HumanModelAssetMeta 参数 参数类型 描述 style_id