检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
package_url 参数 参数类型 描述 training_data_uploading_url String 上传的训练数据地址,用户需要将训练数据打成zip包后上传到该url。 说明: 通过该obs地址上传时需要设置content-type为application/zip
具备如下特点: 2D模型,通过拍摄真人视频训练生成 无表情&骨骼数据 只能由AI驱动 使用既定表情&动作 IP型数字人:由计算机图形学技术创造出来的与人类形象高度接近的数字化形象。 具备如下特点: 3D模型,通过艺术设计生成 有表情、骨骼数据 可由真人动作驱动 能呈现自定义表情&动作 剧本、画布和设置
视频大小通常小于5G。 提交训练的视频需要保留录制时的原声。 若对素材进行后处理,导出时请确保帧率与原视频保持一致。 时长 视频时长通常为5~6分钟。请勿剪辑视频长度,确保讲述视频、静默、手势,一起导出至同一个视频中。 美颜 如需对视频进行美颜等处理,确认美颜效果后,检查素材,确保
在AIUI开放平台界面上方的主菜单中,选择“产品接入 > 我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 在左侧导航栏中,选择“应用数据统计 > 服务统计”,进入“服务统计”页面,如图1所示。 通过下图可以看出,科大讯飞免费赠送500次/天的问答交互。 图1 服务统计页面
稿一:华为云MetaStudio介绍 基于盘古数字人大模型,华为云MetaStudio打造了一站式、全流程的数字人直播服务,通过高效的训练和推理服务,重塑千行百业的电商直播。 数字人模型生成和驱动:基于一张照片或者一段3-5分钟视频,可以生成分身数字人模型,生成效率相比业界提升3
照片数字人限制 照片数字人视频制作限制说明,如表1所示。 表1 照片数字人视频制作限制 照片数字人视频制作配置 限制 人像照片 制作照片数字人的人像照片拍摄要求,如下所示: 真人正面照,不支持动漫卡通形象;面部占比50%以上,侧脸俯仰角度不超过15度。 五官清晰无遮挡,目视前方。
三月二日,神舟十五号乘组进行了二次出舱活动,在轨三个月取得多项阶段性成果。 第三十一届世界大学生运动会在成都隆重开幕,市民健康跑迎接大运会。 从中国音乐家发布的数据来看,国内有超过四千万孩子学习钢琴。 近日,中国探月航天形象太空兔正式对外公布名称, 中文名“兔星星”。 据悉,今年上半年,中国造船三大指标全面增长,
data 是 ChatReqDataInfo object 对话请求数据信息。 表7 ChatReqDataInfo 参数 是否必选 参数类型 描述 text 是 String 文本信息。 seq 否 Integer 数据包序号。 is_last 否 Boolean 判断是否为最后一个文本。
如何调用MetaStudio接口? 照片建模任务创建失败是什么原因? 照片建模任务出现异常问题怎么办? 风格化照片建模的照片有什么要求? 肢体驱动数据格式如何定义? 更多 智能客服 您好!我是有问必答知识渊博的的智能问答机器人,有问题欢迎随时求助哦! 社区求助 华为云社区是华为云用户的聚
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER:
默认取值: UPLOAD_VIDEO video_multipart_count 否 Integer 训练视频上传分片数(上传时对唯一训练视频文件的数据分片,用于对该文件的并发上传,不是分多个视频文件上传)。 取值范围: 1-1000 默认取值: 1 action_video_multipart_count
如需使用第三方声音进行语音合成,请购买出门问问声音套餐。 图1 声音合成 功能介绍 该接口用于TTS流式合成音频,用于文本转化为语音,并实时返回合成的音频数据。 调用方法 构造请求 请求URL:wss://metastudio-api.{region}.myhuaweicloud.com:443
创建用户并授权使用MetaStudio 如果您需要对您所拥有的MetaStudio进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),通过IAM,您可以: 根据企业的业务组织,在您的华为云账号中,给企业中不同
获取TTS试听文件 功能介绍 该接口用于获取TTS试听文件下载链接,返回List中包含当前已生产的试听文件。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/ttsc/audition-file/{job_id} 表1 路径参数 参数 是否必选
支持流式文本消息。seq为流式文本序号,从1开始计数;is_last用于判断流式文本的最后一包数据。如果不使用流式文本消息,seq设置为“1”,is_last设置为“true”。 建议每个分包数据长度大于6个字,否则可能会导致数字人说话卡顿。 详细交互流程如下所示: 用户发送文本驱动消息。
修改TTS租户级自定义读法配置 功能介绍 该接口用于修改TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/ttsc/vocabulary-configs/{vocabulary_id} 表1 路径参数 参数 是否必选
修订记录 表1 修订记录 修改时间 修改说明 2025-01-14 本次变更如下: 新增发布3.0.2版本SDK,相比3.0.1版本,变更点如下所示: 语音唤醒能力支持设备切换实时生效。 2024-12-30 本次变更如下: 新增发布3.0.1版本SDK,相比2.2.0版本,变更点如下所示:
创建TTS试听任务 功能介绍 该接口用于创建生成播报内容的语音试听文件任务。 第三方音色试听需要收费,收费标准参考:https://marketplace.huaweicloud.com/product/OFFI919400645308506112#productid=OFFI919400645308506112
删除资产 功能介绍 该接口用于删除资产库中的媒体资产。调用该接口删除媒体资产时,媒体资产会放入回收站中,不会彻底删除。如需彻底删除资产,需增加“mode=force”参数配置。 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/digital-assets/{asset_id}
删除安抚话术 功能介绍 该接口用于删除安抚话术。 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/digital-human-chat/pacify-words/{pacify_words_id} 表1 路径参数 参数 是否必选 参数类型