检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
批量创建知识库问法 功能介绍 该接口用于批量创建知识库问法。接口使用限制详见API使用限制。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/knowledge/question-batch 表1 路径参数
创建TTS试听任务 功能介绍 该接口用于创建生成播报内容的语音试听文件任务。 第三方音色试听需要收费,收费标准参考:https://marketplace.huaweicloud.com/product/OFFI919400645308506112#productid=OFFI919400645308506112
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则
文本驱动SSML定义 MetaStudio语音驱动采用语音合成标记语言(SSML,Speech Synthesis Markup Language)来控制数字人的行为,包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。MetaStudio
修订记录 表1 修订记录 修改时间 修改说明 2025-02-18 本次变更如下: 新增发布3.1.0版本SDK,相比3.0.2版本,新增HwICSUiSdk.esm.js文件,使用esmodule模块化标准。当使用vite构建的项目无法顺利import HwICSUiSdk.js
系统资产标签定义 查询资产列表接口支持使用“tags”标签对分身数字人模型进行分类。 “tags”取值及其含义,如表1所示。 表1 tags标签说明 tags取值类型 说明 数字人类型 取值如下: VIRTUAL_AVATARS:分身数字人 VIRTUAL_HUMANS:虚拟数字人
智能交互支持富媒体吗? 支持的富媒体格式 用户与数字人进行智能交互问答时,支持展示如下格式的富媒体: 图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体,示例如表1所示。以奇妙问知识库为例,可以通过新增知识库来补充富媒体知识。
快速入门 环境要求 Web SDK运行环境要求,如表1所示。 表1 环境要求 环境项 使用限制 开发工具 Microsoft Visual Studio Code、WebStorm或其他Web IDE开发工具。 语言 Javascript或Typescript。 编译环境 建议Node
直播控制RTSA Command命令说明 直播控制RTSA Command命令详细说明,如下所示: 数字人直播状态变化图 RTSA Command定义 数字人直播状态变化图 数字人直播状态变化流程图,如图1所示。 图1 直播状态变化流程图 流程图说明,如下所示: PREPROCESSING
API概览 华为云MetaStudio服务对应的接口列表如下所示,在调用API前,您需要先获取用户Token,Token可以用于调用其他API时鉴权,具体如何调用API请参考应用示例。 数字资产管理 表1 数字资产管理接口 接口 说明 POST /v1/{project_id}/digital-assets
资源类型 MetaStudio计费中涉及的资源类型,包括商用资源类型、POC测试用需管理员分配的资源类型。 表1 商用资源类型(租户订购) 类别 资源名称 单位 计费模式 资源类型编码 备注 分身数字人 形象制作 个 一次性 hws.resource.type.metastudio.avatarmodeling.number
常见问题 智能交互SDK安装包里为什么有图片资源? SDK里面包含图片资源,是因为智能交互的动效、背景可能需要图片资源才能展示更好的效果。所以智能交互Web SDK为了方便用户集成使用,会同时包含UI相关资源。 speechRecognized和semanticRecognized
智能交互公共配置 智能交互界面支持添加角色、背景、对话配置,可参考本节进行操作。 角色 角色界面详情,如图1所示。 图1 角色界面 角色界面说明,如表1所示。 表1 界面元素说明 界面元素 说明 定制数字人 单击“定制数字人”,跳转至形象制作页面,界面详情和操作指导,详见创建分身数字人定制任务
接口参考 主入口(HwICSUiSdk) 事件通知(EventMap) 错误码(ICSError) 授权浏览器麦克风的访问权限 Web语音唤醒 父主题: Web SDK
肢体驱动数据格式如何定义? MetaStudio肢体驱动数据的前三个为Hips骨骼的Translation信息,按XYZ排列,后接75根骨骼的旋转数据,具体定义如下: 序号 骨骼名称 0 Hips 1 Spine 2 Spine1 3 Spine2 4 Spine3 5 Neck
智能交互第三方LLM回调接口 功能介绍 MetaStudio智能交互服务支持开发者自定义数字人大脑(即第三方LLM)。当用户与数字人对话时,将触发调用该接口,由该接口返回问题对应的答案文本内容。 签名计算方法 第三方LLM自定义接口,使用HMACSHA256签名模式,需要在URL中追加参数
最新动态 本文介绍了数字内容生产线 MetaStudio各特性版本的功能发布和对应的文档动态,新特性将在各个区域(Region)陆续发布,欢迎体验。 2022年12月 序号 功能名称 功能描述 阶段 相关文档 1 数字内容生产线服务上线(受限公测) MetaStudio依托图形引擎和空间引擎两大媒体引擎
SDK合规使用指南 《中华人民共和国个人信息保护法》自2021年11月1日起正式施行后,监管部门、各行业参与方和终端消费者越来越关注用户的隐私保护问题。为了有效治理App、SDK违规收集使用个人信息的现象,监管部门也陆续出台相关标准规范。 您作为华为云客户为最终用户提供服务,知悉并确认将遵守适用的法律法规和相关的标准规范
查询音色ID 支持在MetaStudio控制台或通过API接口查询音色ID,详情如下所示: 在控制台查询音色ID(方式一):仅支持查询自定义音色ID。 在控制台查询音色ID(方式二):支持查询全量音色ID。 使用接口查询音色ID(方式三):支持查询全量音色ID。 在控制台查询音色ID
账户设置 默认情况下,同一华为云账号下的IAM子账户资源共享,如下所示: 各IAM子账户的已购资源共享:即每个IAM用户看到的可用资源总量是所有IAM用户已购资源可用数量的总和,所有IAM用户都可以使用。所以即使当前IAM用户没有消耗资源,如果其他IAM用户在消耗资源,也会看到资源数量在减少