检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查询资产概要 功能介绍 该接口用于查询媒体资产库中指定的多个资产的概要信息。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-assets/summarys 表1 路径参数 参数 是否必选 参数类型 描述 project_id
t_id”,即要查询的音色ID。 图2 查询音色ID 使用接口查询音色ID 支持使用查询资产列表接口,查询音色ID。需要设置如下参数: offset=0:从第一个音色开始查询,可以根据实际情况设置。 limit=60:一次可以查询的声音数据,可以根据实际情况设置。 asset_t
请根据实际情况,配置下述信息: 资产标题:图片的标题。 图片简介:图片的基本介绍,方便了解和使用。 风格:关键词标签,方便用户搜索此类型的资产。 基本信息:图片的用途。 图3 上传图片 单击“图片上传”区域,从本地选择需要上传的图片资产。 单击界面右上方的“保存”,在弹出的“资产保存成功”对话框中,单击“知道了”。
设置完成后,单击“生成视频”,弹出如图2所示的对话框,显示照片数字人视频的生成进度。 可执行下述操作: 单击图中第一个链接“任务中心-视频”,可进入“任务中心 > 照片数字人”页面,查看任务进度,详情请参见查看任务。 单击图中第二个链接“我的创作-视频”,可进入“我的创作 > 视频”界面,查看已生成的视频,详情请参见查看视频。
查询用户配置的个性化音频时长 功能介绍 查询用户配置的个性化音频时长 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/tenant-duration-cfg 表1 路径参数 参数 是否必选 参数类型
auto_analysis Boolean 参数解释: PPT是否需要自动解析。 约束限制: 部分过于复杂的PPT或压缩比过高的PPT可能无法解析。 超过50页PPT仅转换50页 转换的图片无法保证完全还原,需要自行确认。 取值范围: true: 自动解析 false: 无需解析 默认取值:
提示模板不可用怎么办? 请根据实际情况判断处理: 如果是自己创建的模板不可用,请检查模板中的资产是否正常,即资产处于激活状态时正常,如果资产取消激活或已删除会导致模板不可用。 如果是分享给我的模板不可用,可能是分享者取消了模板分享,或者模板中的资产状态不正常,即资产已取消激活或被删除。
交互服务之间的Websocket连接。 连接建立成功后,MetaStudio智能交互服务已准备就绪,会发送START_CHAT命令给第三方应用。第三方应用接收到START_CHAT命令后,用户开始发送文本驱动命令。 详细交互流程如下所示: 用户请求建立与数字人对话的WebSocket连接。
取任务中的房间信息。params结构定义:与直播间详情响应体一致。 CLEAN_UP_INSERT_COMMAND:清理未播放的插入命令。params结构定义:CleanUpInsertCommand 默认取值: 不涉及 params 否 Object 参数解释: 命令参数。 约束限制:
分身形象制作管理 创建分身数字人模型训练任务 查询分身数字人模型训练任务列表 查询分身数字人模型训练任务详情 删除分身数字人模型训练任务 更新分身数字人模型训练任务 租户执行分身数字人模型训练任务命令
请选择输出模型语言 选择输出的声音模型支持的语言。 支持如下语言: 多语种:输出的声音模型,支持合成的语言类型包括中文、英文、德语、法语、土耳其语、菲律宾语、日语、意大利语、马来语、俄罗斯语、韩语、芬兰语、西班牙语、印尼语、阿拉伯语、葡萄牙语、荷兰语。 粤语 选择声音标签 声音的标签。作用为选择声音时,快速筛选领域。
分声音使用场景。 请选择声音性别 声音的性别,用于匹配声音模型的精准度。 如下所示: 男生 女生 原始输入语言 上传语料所使用的语言。 包含如下语言: 中文 英文 须知:当前参数配置仅作为标识,对训练结果没有任何影响。 选择声音标签 声音的标签。作用为选择声音时,快速筛选领域。 包含如下选项:
the limited-time discount! We promise that after purchasing the designated home robot, you will enjoy high-quality after-sales service and guarantee
获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。
VoiceConfig 参数 参数类型 描述 voice_asset_id String 参数解释: 音色资产ID,可以从资产库中查询。 音色ID的查询操作,详见查询预置音色ID。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 speed Integer
String 应用ID。从数字人互动页面URL中获取,URL的获取方式,请参见《用户指南》的“创建智能交互数字人”章节。 chat_id 是 String 对话ID。 command 是 String 操作命令。 包含如下命令: TEXT_DRIVE:文本驱动 INTERRUPT_CHAT:中断对话
单击图中第一个链接“任务中心-分身名片”,可进入“任务中心 > 分身名片”页面,查看任务进度,详情请参见查看任务。 单击图中第二个链接“我的创作-名片”,可进入“我的创作 > 分身名片”界面,查看已生成的名片,详情请参见查看名片。 图3 名片生成进度 等待名片生成完成后,界面会提示“名片生成成功”,如图4所示。
字,单段落不多于2000字的要求。 段落1.1:大家好,今天欢迎来到会议室,我们今天讨论的主题是:如何更好的学习和工作。 段落1.2:我们每个人都有自己的学习和工作,难免会遇到一些问题。当我们遇到问题的时候,应该如何解决的呢? 图2 文本驱动 文本内容的操作说明如表1所示。 表1
参数解释: 字体。当前支持的字体请参考服务支持的字体 约束限制: 不涉及。 取值范围: 字符长度0-64位 默认取值: HarmonyOS_Sans_SC_Black font_size 否 Integer 参数解释: 字体大小。接口的取值范围为0-120,实际业务使用的取值范围要求为24-120,请以业务实际使用要求为准。
热点问题会展示在如图5所示②区域的位置。 语言 数字人对话界面的语言。包含:中文、英文。 支持同时添加中文和英文,并设置其中一种语言为默认语言,则界面信息按照默认语言进行展示。进入智能交互页面时,页面也按照默认语言进行展示,可通过界面右上方的语言切换图标,切换界面展示的语言,同时也是用户与数字人交互的语言。