检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
对提供的答案去答复。 图1 标题 图2 分级标题 配置应用:应用先开启“星火大模型”,再开启文档问答库,然后启用创建技能中已创建的技能。 查看应用信息:在MetaStudio服务创建“科大讯飞星火交互认知大模型”智能交互对话项目时,需要使用这里的应用信息,包括:应用名称、APPID、APPKEY和APISECRET。
设置视频的场景,包括如下内容。视频素材的操作详情,请参考视频制作公共配置。 模板:系统预置视频模板列表。支持基于系统预置模板,一键快速制作数字人视频。 注意:只有管理员可以自定义新增模板。 角色:自动展示系统预置的分身数字人列表,用户可以直接使用已有的数字人去创作生成视频。如果预置的数
可以看到用户创建的所有直播间的开播任务列表。如果同一个直播间,开播多次,则生成对应个数的开播任务。 可以查看任务ID、直播名称、封面、创建时间、开播时间、结束时间和当前的直播状态(直播中或直播结束)。 如果直播结束,可单击直播间任务右侧的“查看详情”,进入当前直播间,修改直播间内容,重新开播。 图1 直播任务管理
音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作: 单击商品所在行的“查看”,进入商品详情界面,支持单击“编辑”,修改商品信息。 单击商品所在行的“编辑”,进入商品修改页面,修改商品信息后,单击“保存”。 单击商品所在行的“删除”,删除当前商品。
声音模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 视频制作 使用系统预置或自定义生成的数字人形象、声音,制作音视频内容。 制作的视频可应用于教学、培训等各类场景中。 视频直播 使用系统预置或自定义的数字人形象、声音,制作音视频直播内容。 可通过下述方式,在直播平台开播。
2025-01-14 本次变更如下: 新增发布3.0.2版本SDK,相比3.0.1版本,变更点如下所示: 语音唤醒能力支持设备切换实时生效。 2024-12-30 本次变更如下: 新增发布3.0.1版本SDK,相比2.2.0版本,变更点如下所示: 新增语音唤醒能力,详见Web语音唤醒。
查询视频驱动任务详情 功能介绍 该接口用于查询视频驱动任务详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/video-motion-capture-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
VoiceConfig 参数 参数类型 描述 voice_asset_id String 参数解释: 音色资产ID,可以从资产库中查询。 音色ID的查询操作,详见查询预置音色ID。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 speed Integer
查询视频驱动任务列表 功能介绍 该接口用于查询视频驱动任务列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/video-motion-capture-jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
它不仅拥有出色的功能,还具备卓越的性能。 让您可以轻松体验畅快无比的运行速度和极致的使用感受。 这款家用机器人具备稳定的电力供应和支持系统。 这款家用机器人还具备精细化的动作控制与执行能力。 无论是行走、搬运物品还是执行其他动作,机器人都能轻松应对。 这款家用机器人还采用了超
为避免不好的体验,可以配置安抚话术,及时安抚用户情绪,耐心等待回复。 开启安抚话术后,可以看到“通用安抚话术”。系统预置30个话术,需要单击“添加话术”,一一添加系统话术,支持修改。 还需配置下述参数: 触发时长:设置通用安抚话术的触发时间,在这时间之前如果答案未生成,则播报此安抚话术。
同意协议。单击“确定”,开通按需计费。 如需查看声音合成的使用量,单击左下角的“已使用量”,跳转至费用中心的“流水和明细账单”页面,搜索查看声音合成的详细账单。 3D数字人 照片建模 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。 语音驱动 左下角展示
Integer 偏移量,表示从此偏移量开始查询。 取值范围: 0-2147483647 默认取值: 0 limit 否 Integer 每页显示的条目数量。 取值范围: 1-100 默认取值: 10 room_name 否 String 按直播间名称模糊查询。 dh_id 否 String
声音更新记录 2025年1月 表1 声音更新记录 发音人名称 性别 TTS版本 风格 语言 变更方式 云海 男 TTS V7 营销 中文 新增 云佳 女 TTS V7 客服 中文 新增 云辉 男 TTS V7 直播 中文 新增 云英 女 TTS V9 直播 中文 新增 云薇 女 TTS
相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”。 在智能交互编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。 参数配置说明,如表1所示。 图1 创建应用 表1 创建应用 参数 说明 第三方应用 选择“第三方语言模型”。
1次/秒 1次/秒 查询直播平台列表 20次/秒 10次/秒 10次/秒 查询第三方直播平台信息 20次/秒 10次/秒 10次/秒 查询第三方直播平台商品列表 5次/秒 3次/秒 3次/秒 智能交互数字人对话管理 创建智能交互对话 5次/秒 3次/秒 - 查询智能交互对话列表 20次/秒
示例:小贴士。 筛选条件 支持通过贴图来源的维度,筛选展示下方的图片。 图片列表 默认展示全量图片。 查看贴图 将鼠标放在图片上方,图片右上角展示图标。单击图标,可查看大图。 插入贴图 将鼠标放在图片上方,图片右上角展示图标。单击图标,添加至当前场景的视频直播画面中。 在视频
Command命令说明 直播控制RTSA Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值 预置音色ID列表 查询音色ID
zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav 支持手机录制20条语料音频(5分钟),1
查询任务操作日志 功能介绍 查询任务操作日志 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs/{job_id}/op-logs 表1 路径参数 参数 是否必选 参数类型 描述 project_id