检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
语音合成管理 创建TTS试听任务 获取TTS试听文件 创建TTS异步任务 获取TTS异步任务 设置TTS租户级自定义读法配置 获取TTS租户级自定义读法配置 删除TTS租户级自定义读法配置 修改TTS租户级自定义读法配置 语音同步合成WebSocket接口
3D数字人风格管理 查询数字人风格列表 父主题: 3D数字人
3D数字人风格化照片建模 创建照片建模任务 照片建模任务列表查询 照片建模任务详情查询 基于图片URL创建照片建模任务 父主题: 3D数字人
3D数字人视频驱动 创建视频驱动任务 查询视频驱动任务列表 查询视频驱动任务详情 停止视频驱动任务 控制数字人驱动 父主题: 3D数字人
参数配置说明,如表1所示。 图2 资产转移 表1 参数说明 参数 说明 用户账号 需要接收资产的租户,其所在Region的项目ID,获取方法请参见获取项目ID。 备注 转移资产的备注信息。 接收方式 租户接收资产的方式。 包含如下设置: 资产转移后用户自动接收:建议勾选,这样资产转移后,租户无需再执行
SDK默认方式展示效果 富媒体展示效果(自定义方式) 用户与数字人进行智能交互的页面,默认为用户需要自定义富媒体的展示效果,即用户自定义UI界面展示。 通过注册事件通知semanticRecognized获取回复文本,用户可以自行提取图片、视频标签进行自定义显示。 父主题: 智能交互
如何实时切换智能交互的语言和声音? 在展厅等智能交互场景中,会有切换智能交互界面,数字人说话语言和声音的需求。 请参考下述步骤操作: 登录MetaStudio控制台。 如果是展厅场景,需要切换到“华北-北京四”区域。因为展厅的配置,均在“华北-北京四”区域。 在左侧导航栏中,选择“我的创作”。
切割,自动识别文本内容。 音频文件命名无要求,可自定义,命名示例:Voice.wav。 进阶版 高品质 制作声音模型 准备好音频文件后,就可以上传至MetaStudio控制台,进行声音训练。详细操作如下所示: 创建声音制作任务(自研模型) 查看声音 声音模型制作耗时,如下所示: 基础版:约1~3个工作日。
在右侧界面的“Preview”页签中,可以看到所有音色的“asset_id”,即要查询的音色ID。 图2 查询音色ID 使用接口查询音色ID 支持使用查询资产列表接口,查询音色ID。需要设置如下参数: offset=0:从第一个音色开始查询,可以根据实际情况设置。 limit=60:一次可以查询的声音数据,可以根据实际情况设置。
华为云提供了MetaStudio服务端SDK,您可以直接集成服务端SDK来调用MetaStudio的相关API,从而实现对MetaStudio服务的快速操作。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 您可以在API Explore
除。 支持设置为纯色背景,可以选择已有的颜色,也可以自定义颜色。 筛选条件 支持通过背景、类型的维度,筛选展示下方的图片。 图片列表 默认展示全量图片。选中场景,单击图片,可以替换当前场景的背景。 将鼠标放在图片上方,图片右上角展示图标。单击图标,可以将当前图片作为背景替换至所有场景。
今天我们的直播时间是八点到十二点,宝宝们有任何疑问都可以打在公屏上。 欢迎新进直播间的宝宝们,还没关注主播的可以先点一点左上方的关注。 右下角的点赞也可以一起点起来!今天我们直播间会有不定时的点赞抽奖活动哦! 来,先给大家上一款减脂期可以解馋的饼干。 这个包装看起来就非常有食欲对不对?
智能交互根据客户需要,后台提供多种知识库配置,支持配置中英双语。 智能交互基于已有训练生成的数字分身形象模型和声音模型,结合知识库,可与用户进行实时对话。 用户购买路数越多,同时进行数字人交互对话的数量则越多。 资源超过有效期后将无法使用,建议开通自动续费功能。 包年/包月 照片数字人视频制作
不过数量都比较少,真的要拼手速宝宝们! 今天直播间会有超级秒杀价,比双十一还要便宜哦! 欢迎新进直播间的宝宝们,还没关注主播的可以先点一点左上方的关注。 右下角的点赞也可以一起点起来!今天我们直播间会有不定时的点赞抽奖活动哦! 这款饼干包装看起来就非常有食欲对不对? 这款饼干真的非常适合喜欢吃零食,但又想控制热量的宝宝。
数字人。 操作前准备 用户创建分身数字人定制任务前,需要参考操作步骤准备如下内容: 5~6分钟绿幕拍摄视频。 注意:如果制作分身形象的时候,选择保留拍摄背景,则需要准备实景背景拍摄视频。 身份证正反面照片。 形象授权签署文件,如授权书所示。 操作步骤 登录MetaStudio控制台。
常用概念 数字人 数字人是一种以数字形式存在于数字空间中的虚拟人物,它具有拟人或真人的外貌、行为特点,并具备一定的智能和情感,可以进行交互和表达。数字人也可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。
单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。 授权书内容,可参考授权书。 单击“提交制作”。 弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。 如果用户确认无误,单击“确认提交”。
音频输入至数字人驱动模型后,经过模型推理生成数字人形象播报视频。 数字人视频通过审核后返回给用户。 算法应用场景 分身数字人驱动算法可以应用于真人视频自动生成,包括新闻播报、课件制作等场景,以取代真人视频拍摄,提升视频内容生产效率。 算法目的意图 可以使用授权过的真人视频,在预训练模型基础上,生成真人数字人驱动
支持通过背景、风格和布局的维度,筛选展示下方的图片。 图片列表 默认展示全量图片。选中场景,单击图片,可以替换当前场景的背景。 将鼠标放在图片上方,图片右上角展示图标。单击图标,可以将当前图片作为背景替换至所有场景。 贴图 贴图界面详情,如图3所示。 图3 贴图界面 贴图界面说明,如表3所示。
表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String