检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数字人名片制作管理 创建数字人名片制作 查询数字人名片制作任务列表 查询数字人名片制作任务详情 更新数字人名片制作 删除数字人名片制作任务 父主题: 分身视频制作
创建TTS异步任务 功能介绍 该接口用于对外生成音频文件 使用本接口前,需要在MetaStudio控制台服务概览页面,开通“声音合成”的按需计费。 详细操作为:单击“声音合成”卡片中的“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。
数字人直播技术,可以云上随时随地24小时直播,不耽误村民日常劳作,同时实现话术自动生成,用专业、流利的直播话术,打开市场销路,让农产品走出大山,走向世界。 万兴科技联合华为云MetaStudio,打造跨境全场景数字人服务的AI视频创意软件万兴播爆。基于华为云MetaStudio,
o控制台,根据开通引导完成服务开通。 如果华为云账号无法满足用户的使用诉求,可参考创建用户并授权使用MetaStudio,创建IAM用户,进行精细化的权限管理。 推荐使用Chrome浏览器访问MetaStudio控制台。 如果华为云账号被冻结,将无法对MetaStudio服务进行
MetaStudio控制台默认不展示“子账户隔离配置”菜单,需提交工单,并提供当前华为云账号所在Region的项目ID(详见获取项目ID),申请开通后展示。 开通成功后,仅华为云账号下展示“子账户隔离配置”菜单,IAM子账户均不展示。 注意事项 如果华为云账号已通过API接口字段“X-App-UserId”自定义资产隔离能力。那么:
更新分身数字人模型训练任务 功能介绍 该接口用于更新分身数字人模型训练任务。用于在自动审核或者人工审核不通过情况下,更新训练视频、身份证照片等。 该接口只能在AUTO_VERIFY_FAILED或者MANUAL_VERIFY_FAILED状态下调用 调用方法 请参见如何调用API。
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。
所有资源的购买操作均相同,下面以“分身数字人形象制作”为例,进行操作演示。 前提条件 当前用户已拥有SP账号。 操作步骤 使用SP用户登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线 MetaStudio”服务,进入MetaStudio服务概览页面,如图1所示。
第三方SDK名称:数字人智能交互Web SDK 第三方公司名称:华为云计算技术有限公司 收集个人信息类型:您或您的最终用户的音频数据或文本数据、应用信息(浏览器User Agent)、SDK接口调用记录。 使用目的:为华为云客户应用提供数字人智能交互服务,如果您只使用部分SDK功能,则可以根据实际功能进行裁剪。
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
方式一:MetaStudio预集成数字人大脑和大模型,集成商或客户基于SDK开发智能交互应用。 预集成大脑和大模型类型包括: 华为云CBS,详见创建智能交互数字人(华为云CBS)。 科大讯飞AIUI通用语义模型,详见创建智能交互数字人(科大讯飞)。 科大讯飞星火交互认知大模型,详见创建智能交互数字人(科大讯飞)。
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
SDK概述 华为云提供了MetaStudio服务端SDK,您可以直接集成服务端SDK来调用MetaStudio的相关API,从而实现对MetaStudio服务的快速操作。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。
开发者如何获取技术支持? 如果开发过程中遇到问题,可以提单MetaStudio服务处理。 详细操作如下所示: 访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。
音色名称(英文) 资产ID(亚太-新加坡) 云歌 075494c45b5aef529d55cd2a456e6076 0a4b548fd8d2d6998e1fc3fffb29f9bc Yun Ge cbcfbfa73488876ce507144c87307440 云峰 d8cd17100beaf4c2d09355731ebe7e37
开发者如何获取技术支持? 如果开发过程中遇到问题,可以提单MetaStudio服务处理。 详细操作如下所示: 访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。
服务概览 登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线 MetaStudio”服务,进入MetaStudio服务概览页面,如图1所示。 图1 服务概览页面 MetaStudio服务概览页面一共包含3块区域,详细说明如下所示: 服务介绍
智能交互第三方LLM回调接口 功能介绍 MetaStudio智能交互服务支持开发者自定义数字人大脑(即第三方LLM)。当用户与数字人对话时,将触发调用该接口,由该接口返回问题对应的答案文本内容。 签名计算方法 第三方LLM自定义接口,使用HMACSHA256签名模式,需要在URL
下面以语音合成套餐为例,进行操作说明。其他声音套餐的操作均相同。 已购语音合成套餐用尽后,须知: 如果使用相同的华为云账号再次购买套餐,则accessKey和secretKey不变。 如果使用其他华为云账号再次购买套餐,则需更新accessKey和secretKey后使用,操作请参考续购套餐。 访问
智能交互支持富媒体吗? 支持的富媒体格式 用户与数字人进行智能交互问答时,支持展示如下格式的富媒体: 图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体,示例如表1所示。以奇妙问知识库为例,可以通过新增知识库来补充富媒体知识。