检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单击“管理技能配置”,在弹出的“配置应用需要的技能”对话框中,设置需要的系统预置技能,如图7所示。 示例:可以开启“生活”分类中的“天气”技能,这样用户就可以提问天气相关的问题。启用这类预置技能,可以支持用户进行闲聊。 图7 系统预置技能 全部设置完成后,单击对话框右上角的“保存配置”。 开启讯飞的闲聊功能。
模板:系统预置视频模板列表。支持基于系统预置模板,一键快速制作数字人视频。 注意:只有管理员可以自定义新增模板。 角色:自动展示系统预置的分身数字人列表,用户可以直接使用已有的数字人去创作生成视频。如果预置的数字人不满足用户需求,单击“定制数字人”,可以定制自己需要的数字人形象。 用户自定义的Flexus分身数字
文本驱动 音频制作完成后,可单击音量图标,调整音频的音量。 上述操作全部完成后,第一个场景的视频内容已制作完成。 如果还需要制作更多场景,可单击“场景”区域的“+”图标,新增场景。制作过程参考第一个场景即可。 图3 场景区域 所有场景设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。
Flexus分身数字人 按Flexus数字人生成个数和声音克隆个数计费。 须知: 每提交一个Flexus分身数字人定制任务,会同时生成一个Flexus形象和一个Flexus声音,对应消耗一个形象资源和一个声音资源。 按需预付费套餐包 一次性计费 Flexus分身数字人视频制作 按Flexus数字人视频制作时长计费。
对话ID,每轮问答的ID值唯一。 speechRecognized通知的流式返回跟semanticRecognized是有差异的,详细见:speechRecognized和semanticRecognized通知的流式返回有什么差异? semanticRecognized 【事件说明】 LLM对提问进行语义识别
在右侧界面的“Preview”页签中,可以看到所有音色的“asset_id”,即要查询的音色ID。 图2 查询音色ID 使用接口查询音色ID 支持使用查询资产列表接口,查询音色ID。需要设置如下参数: offset=0:从第一个音色开始查询,可以根据实际情况设置。 limit=60:一次可以查询的声音数据,可以根据实际情况设置。
单击“管理技能配置”,在弹出的“配置应用需要的技能”对话框中,设置需要的系统预置技能,如图13所示。 示例:可以开启“生活”分类中的“天气”技能,这样用户就可以提问天气相关的问题。启用这类预置技能,可以支持用户进行闲聊。 图13 系统预置技能 全部设置完成后,单击对话框右上角的“保存配置”。 开启讯飞的闲聊功能。
业内部培训、IP知识视频宣传等。 通过分身数字人进行教育宣传和教育资源推广,进行线上教学和培训,不仅可以大幅节约师资成本,还可以提升教学质量。通过减少对人力的依赖,使教育机构可以将更多精力投入到创新和教学内容的优化上,从而实现更高效的教育体系。 医疗健康 医学科普是近年来政策倡导
预置模特使用限制 MetaStudio控制台预置模特的有效使用期为3年,在2027年的年中前用户可以放心使用。具体下线时间请关注MetaStudio服务,会提前3个月在现网开放下线公告。 父主题: 使用限制
如图2所示。 图2 资源管理 单击“分身数字人形象制作”右侧的“激活”,弹出“激活资源”对话框,如图3所示。 可以看到资源名称、总量、可激活数量和激活截止时间。可以自主设置激活数量,无需一次性全部激活。 图3 激活资源 根据实际情况,设置本次需要激活的数量,单击“确定”。 界面
分配给租户使用。 单击“确定”,界面右上角提示“分配资源成功”。 在“租户列表”页面,可以查看分配效果,如图4所示。 以001租户的“分身形象制作(个)”列为例进行说明,“2 / 2”中第一个2说明当前资源实例分配了2个分身形象制作资源给当前租户;第二个2的含义为当前租户还剩余2个分身形象制作资源可用。
使用AK/SK认证时,您可以基于签名算法使用AK/SK对请求进行签名,也可以使用专门的签名SDK对请求进行签名。详细的签名方法和SDK使用方法请参见API签名指南。 签名SDK只提供签名功能,与服务提供的SDK不同,使用时请注意。 Token认证 Token的有效期为24小时,需要使用一个Toke
单击“新建词表”,界面新增一行特殊词,如图2所示。 在“原始词”列输入原始内容。 在“新建读法”列,输入拼音后,从下拉框中选择正确的读音。如有多个字,需单击“+”号图标,依次输入各文字的拼音。 图2 新建词表 单击新增特殊词右侧的“确定”,新增成功。 如有更多特殊词,可参考上述步骤依
视、手表和物联网设备。 这个系统有分布式架构,能让设备间无缝连接和协同工作。 AI在医疗领域的应用发展迅速。 比如,AI图像识别技术可以帮助医生提高疾病诊断的准确性和效率,也可以帮助医疗机构改善资源利用和服务质量。 中国继续推进5G网络建设,多个城市已经实现5G商用覆盖。 5G技
到不同员工之间的权限隔离,您可以使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能,可以帮助您安全地控制资源地访问。 通过IAM,您可以在账号中给员工创建IAM用户,
或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用MetaStudio服务的其它功能。 本章节为您介绍对用户授权的方法,操作流程如示例流程所示。 前提条件 给用户组授权之前,请您了解用户组可以添加的Me
使用照片人像合成视频名称。 02 录入播报内容 选择一种方式,生成播报内容 提供下述种方式,生成照片数字人播报内容。 播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线
视频制作限制 分身数字人视频制作限制说明,如表1所示。 表1 视频制作限制 视频制作配置 限制 场景 一个视频草稿的场景数量不能超过50个。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。 每个单场景如果包含语音合成标记语言SSML标签,文字数量需小于128K。
用户提问结束后,大模型搜索答案进行回复,可能会有延迟。为避免不好的体验,可以配置安抚话术,及时安抚用户情绪,耐心等待回复。 开启安抚话术后,可以看到“通用安抚话术”。系统预置30个话术,需要单击“添加话术”,一一添加系统预置话术,也可以修改为自己的描述。 还需配置下述参数: 触发时长:设置通用
后,启动声音制作。声音模型制作耗时约5个工作日。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。 父主题: 声音制作