检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
获取语音训练任务审核结果 功能介绍 获取语音训练任务审核结果。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs/{job_id}/audit-result 表1 路径参数 参数 是否必选
更新数字人名片制作 功能介绍 该接口用于更新数字人名片制作任务。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/digital-human-business-cards/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
Integer 偏移量,表示从此偏移量开始查询。 取值范围: 0-2147483647 默认取值: 0 limit 否 Integer 每页显示的条目数量。 取值范围: 1-100 默认取值: 10 room_id 否 String 智能交互对话房间ID。 robot_type 否
自动审核失败 MANUAL_VERIFY_FAILED: 人工审核失败 算法训练中 说明: 算法训练中的状态仅管理员需要处理,普通用户仅需要显示“算法训练中”即可。 MANUAL_VERIFY_SUCCESS: 审核通过,等待预处理资源 WAIT_TRAINING_DATA_PREPROCESS:
Integer 偏移量,表示从此偏移量开始查询。 取值范围: 0-2147483647 默认取值: 0 limit 否 Integer 每页显示的条目数量。 取值范围: 1-100 默认取值: 10 robot_id 是 String 应用ID。 region 否 Integer sis服务所在区域
营销宣传风格英文文案 In this rapidly changing world, technology has become an indispensable element in our lives. It constantly drives social progress
Flexus分身数字人形象采集指南 本节将协助您完成Flexus分身数字人形象的采集工作。请注意,您的数字人形象会与录制效果保持一致,包括服装、手部动作、面部表情以及各方面的姿态等。所以我们希望您在拍摄时尽可能保持自然,按照平时的说话习惯录制。 拍摄流程 支持手机或相机拍摄,需1080P或更高分辨率。
创建数字人名片制作 功能介绍 该接口用于数字人名片制作任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-business-cards 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
上报直播间事件 功能介绍 该接口用于上报直播间事件。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/smart-live-rooms/{room_id}/smart-live-jobs/{job_id}/live-event-report 表1
智能交互第三方LLM回调 智能交互第三方LLM回调接口 父主题: 智能交互
声音和形象模型支持在其他平台使用吗? 不支持。声音和数字人模型文件不支持导出和下载,且声音和数字人模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 父主题: 声音和形象制作
智能交互SDK从哪里下载? 下载地址,详见下载SDK安装包。 父主题: API和SDK使用
3D数字人风格化照片建模 创建照片建模任务 照片建模任务列表查询 照片建模任务详情查询 基于图片URL创建照片建模任务 父主题: 3D数字人
设置TTS租户级自定义读法配置 功能介绍 该接口用于设置TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsc/vocabulary-configs 表1 路径参数 参数 是否必选 参数类型 描述 project_id
SDK概述 数字人智能交互SDK是基于数字内容生产线服务提供的能力进行封装,以简化用户的开发工作。用户直接调用智能交互Web SDK提供的接口,即可实现使用数字人智能交互业务能力的目的。 智能交互提供了如下主流平台SDK供开发者使用。 表1 客户端SDK 客户端 集成SDK 接口参考
SDK下载 下载SDK安装包 完整性校验 父主题: 智能交互客户端SDK
制作好数字人后,可以不购买路数进行直播吗? 数字人模型只能通过MetaStudio服务驱动,不与其他第三方服务兼容。数字人形象制作与视频直播是两个独立的功能,需各自计费。可通过包周期或按需计费方式购买路数。 视频直播间的场景布置好之后,可以通过捕捉网页画面或RTMP推流的方式向第
如何实时切换智能交互的语言和声音? 智能交互对话项目支持同时添加中文和英文语言,以实现智能交互页面中英文界面的实时切换。 详细配置说明,如下所示: 登录MetaStudio控制台,单击“智能交互”。 如果是展厅场景,需要切换到“华北-北京四”区域。因为展厅的配置,均在“华北-北京四”区域。
查询用户配置的个性化音频时长 功能介绍 查询用户配置的个性化音频时长 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/tenant-duration-cfg 表1 路径参数 参数 是否必选 参数类型