检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建资产 功能介绍 该接口用于在资产库中添加上传新的媒体资产。可上传的资产类型包括:分身数字人模型、背景图片、素材图片、素材视频、PPT等。 资产类型是IMAGE时,通过system_properties来区分背景图片(BACKGROUND_IMG)、素材图片(MATERIAL_IMG
示例1:上传资产 本节提供通过API Explorer和Postman工具,将资产上传至OBS桶的操作。 总体流程 调用创建资产接口创建资产ID。 调用创建文件并获取上传URL接口创建文件ID,并生成文件上传的URL地址。 使用Postman工具,参考OBS的PUT上传接口,将资产文件上传至
查询资产列表 功能介绍 该接口用于查询资产库中的媒体资产列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-assets 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则
查询语音训练任务列表 功能介绍 查询语音训练任务列表 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则
新闻播报风格文案 我国是世界上首个国内发明专利有效量超三百万件的国家,已位居世界第一。 近日,关于互联网电视收费乱象的话题不断冲上热搜, 互联网电视平台套娃式的充会员看视频的模式让不少网友直呼太反感。 随着版权保护意识的加强,用户已经愿意以付费方式来收看影视内容, 可商家在收费之余却忽视了消费者的观看体验
查询音色ID 支持在MetaStudio控制台或通过API接口查询音色ID,详情如下所示: 在控制台查询音色ID(方式一):仅支持查询自定义音色ID。 在控制台查询音色ID(方式二):支持查询全量音色ID。 使用接口查询音色ID:支持查询全量音色ID。 在控制台查询音色ID(方式一
智能交互驱动WebSocket接口 终端节点获取方式 智能交互驱动WebSocket接口终端节点的获取方式,如表1所示。 表1 终端节点获取方式 场景 获取方式 未通过WEB SDK调用场景 终端节点地址从接口StartSmartChatJob.xml的响应参数chat_access_address
营销宣传风格文案 1. 掌握未来,尽在眼前——揭开全新智能科技产品的神秘面纱 2. 在这个快速变化的世界里,技术已经成为我们生活中不可或缺的重要元素。 3. 它不断推动着我们的社会进步,改变着我们的生活方式。 4. 而现在,一个引领科技浪潮,凝聚了众多顶尖科技的全新智能产品即将横空出世
查询分身数字人模型训练任务列表 功能介绍 该接口用于查询分身数字人模型训练任务列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-training-manage/user/jobs 表1 路径参数 参数 是否必选
配置对话机器人服务CBS 在对话机器人服务配置问答机器人。MetaStudio创建对话时,如果“第三方应用”需要选择“华为云CBS”时,才需要执行本节操作,详情请参考表1。 操作步骤 登录MetaStudio控制台。 单击界面左上角的图标,在弹出的浮动框中,搜索“对话机器人服务 CBS
语音同步合成WebSocket接口 前提条件 本接口目前仅支持“华北-北京四”和“华东-上海一”区域使用,且必须提交工单申请开通后才能使用。 使用本接口前,需要在MetaStudio控制台服务概览页面,开通“声音合成”的按需计费。 详细操作为:单击“声音合成”卡片中的“去开通”,在弹出的
获取语音文件上传地址 功能介绍 获取语音文件上传地址 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs/{job_id}/uploading-address-url 表1 路径参数 参数
权限管理 如果您需要对购买的MetaStudio资源,给企业中的员工设置不同的访问权限,以达到不同员工之间的权限隔离,您可以使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议
创建技能 本节操作如下所示: 在MetaStudio控制台创建并导出技能文件 在科大讯飞创建同名技能后,导入技能文件 在MetaStudio控制台创建并导出技能文件 在MetaStudio控制台创建技能前,需要参考如下表格,在本地使用Excel文件,准备好技能问答对内容。 表1 智能交互问答对参考
智能交互驱动流程 流程图示例 用户与数字人进行智能交互的流程图示例,如下所示,对应流程的详细说明,如流程图总体说明所示。 智能交互非流式驱动流程图,如图1所示。 智能交互流式驱动流程图,如图2所示。 智能交互驱动打断对话流程图,如图3所示。 智能交互驱动停止对话流程图,如图4所示。
查询数字人智能交互任务 功能介绍 该接口用于查询数字人智能交互任务。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/smart-chat-rooms/{room_id}/smart-chat-jobs/{job_id
启动数字人智能交互任务 功能介绍 该接口用于启动数字人智能交互任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/smart-chat-rooms/{room_id}/smart-chat-jobs 表