检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
频。 AV1、H265编码格式目前支持Chrome浏览器,不支持Edge浏览器。 视频素材总大小小于1GB。 同时叠加的视频总数量最多支持2个。 音频格式 音频支持的格式为:MP3、M4A、WAV。 音频要求如下所示: 仅提取单声道音频。 音频素材总大小小于500MB。 图片格式
的file_id(文件ID)和upload_url(文件上传地址,有效期为24小时)的值,待后续步骤使用。 图2 接口页面 参考OBS的PUT上传接口,上传资产文件至2中返回的upload_url(文件上传地址,有效期为24小时)中,如图3所示。 详细操作说明,如下所示: 在Po
"asset_id" : "8cb2f48a2cb006154794741933421100", "asset_file_category" : "MAIN" } 响应示例 状态码:200 成功。 { "file_id" : "b2f8a9e9c39b6dc7ed4c0cfd67366c6a"
表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。
"robot_id" : "b3e2b1db10b34f45bff241b133142627", "hot_words_type" : "SIS", "vocabulary_id" : "036bd500-27cd-4e2d-bba9-0e6baf9c1bd8",
成后,单击“保存”,保存修改。 图1 数字人定制任务 数字人模型会在3个工作日内训练完成。训练完成后的任务状态更新为“算法训练完成”,如图2所示。 查看生成的分身数字人形象是否满足。用户可以在“定制任务详情”界面,执行下述操作。 如果训练生成的数字人形象满足需求,单击右下方的“通
"cover_download_url" : "https://example.com/e477dcf363234b2f8aa2aad4d8bad46b_cover?param1=XXX¶m2=YYY", "last_update_time" : "2023-12-08T01:58:52Z"
"xxxxx2", "xxxxx3", "xxxxx4" ] } 响应示例 状态码:200 成功。 { "results" : [ { "ret_status" : "SUCESS", "asset_ids" : [ "xxxxx1", "xxxxx2" ]
单击“直播平台对接”,进入如图1所示的页面。 图1 直播平台对接页面 单击界面左侧的“新建平台”,弹出“新增第三方直播平台”对话框,如图2所示。 图2 新增第三方直播平台 选择“自定义”,单击“确定”,进入第三方平台信息配置页面,如图3所示。 参数配置说明,如表1所示。 图3 配置页面
内容较多时,最多支持在名片中分2行展示,超出2行后,默认不展示。为保证名片的效果展示,请保持合理的输入长度。 联系电话 必填项,数字人联系电话,请输入有效的联系方式。 公司地址 必填项,数字人公司地址。 内容较多时,最多支持在名片中分2行展示,超出2行后,默认不展示。为保证名片的效果展示,请保持合理的输入长度。
ASSET_MANAGER:资产管理 MODELING_2D:形象制作 LIVE_2D:分身数字人视频直播 VIDEO_2D:分身数字人视频制作 CHAT_2D:分身数字人智能交互 BUSINESS_CARD_2D:分身数字人名片 PICTURE_2D:照片数字人视频 MODELING_3D:3D照片建模
声音制作任务提交成功后,界面提示“制作任务提交成功”,如图2所示。 声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。 声音模型制作耗时,如下所示: 基础版:约1~3个工作日。 进阶版:约1~3个工作日。 高品质:约5个工作日。 图2 制作任务提交成功 用户可以单击“查
"robot_id" : "b3e2b1db10b34f45bff241b133142627", "hot_words_type" : "SIS", "vocabulary_id" : "036bd500-27cd-4e2d-bba9-0e6baf9c1bd8"
单击“下一步”,进入Flexus分身数字人制作页面,如图2所示。 界面操作详情,如表1所示。 图2 形象制作页面 表1 界面操作说明 参数 说明 训练视频 从本地上传已录制好,且符合拍摄要求的真人实景视频,训练生成Flexus数字人形象和Flexus声音。 录制的视频时长1~5分钟,建议2分钟,分辨率需≥1080
cn-north-4 metastudio.cn-north-4.myhuaweicloud.com API使用限制 API使用限制,如表2所示。 表2 API使用限制 限制项 说明 音色调用 用户使用视频直播或智能交互API调用音色时,需要先确认在MetaStudio控制台的视频直播
视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。 服务型数字人是利用深度神经网络进行图像合成、高度拟真的虚拟人。具备如下特点: 2D模型,通过拍摄真人视频训练生成 无表情&骨骼数据 只能由AI驱动 使用既定表情&动作 剧本、画布和设置 视频制作、视频直播功能,都需要进行
role_type 是 String 委托授权类型 CBS:对话机器人服务(CBS)访客 SIS:语音交互服务(SIS)调用 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。需要获取全局级Token(将scope设置为domain)
如需添加标题和分级标题,请使用word标准格式,如图1和图2所示。 txt格式说明:文档内容当前仅支持纯文本,一行对应一条知识。 星火大模型会理解文档库文档的内容,重新组织语言来回答问题,不会完全按照问答对提供的答案去答复。 图1 标题 图2 分级标题 配置应用:应用先开启“星火大模型”,
操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 参考真人声音录制,提前录制一个WAV或MP3格式的长音频文件,每句之间需要有2~3秒的停顿。语料推荐使用文案样例(基础版)。 声音授权签署文件。 操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。
model_version 否 String 参数解释: 分身数字人模型版本 约束限制: 不涉及 取值范围: V2: V2版本模型 V3:V3版本模型 V3_2:V3.2版本模型 默认取值: V2 model_resolution 否 String 参数解释: 分身数字人模型分辨率。 约束限制: