检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数字人开始讲话事件。 speakingStop 数字人结束讲话事件。 speechRecognized ASR对提问进行语音识别后输出为文本的事件。 semanticRecognized LLM对提问进行语义识别后输出回复文本的事件。speechRecognized和semanticRecog
类及其全量语料对,保存文件。 单击“添加文件”,从本地选择文件,单击“确定”。 等待文件导入成功后,可以看到增加成功的问题类别及其全量语料对,示例如图8所示。 图8 批量导入语料 全量导入完成后,单击界面右上方的“对话体验”,输入前面导入的语料对问题。 验证下语料对导入是否成功,示例如图9所示。
过减少对人力的依赖,使教育机构可以将更多精力投入到创新和教学内容的优化上,从而实现更高效的教育体系。 医疗健康 医学科普是近年来政策倡导的一大方向。通过医学科普,对改善已患病人群的术后身心健康等问题起着关键作用。以视频形式为患者提供诊前、诊中、诊后的医学科普服务,加强患者对医生信
可以参考本章节,查看已创建角色的对话记录。 操作步骤 登录奇妙问,左侧导航栏中,选择“会话记录”,如图1所示。 会话记录页面会展示所有角色的历史会话记录。 图1 会话记录 支持对会话进行如下操作。 可以通过项目名称、会话开始时间、会话结束时间,快速查询或者导出需要查看的角色会话信息。其中项目名称与角色名称相同。 单击
索引配置 配置索引的类型。 包含如下选项: 标准版 高配版 单击“保存”。 保存成功后,“普通文档”页签下新增一行知识库。请根据实际情况,对知识库进行编辑、设置或删除操作。 图6 普通文档 上传问答题库的操作。 单击“问答题库”区域的“新建题库”,进入“创建问答库”页面,如图7所示。
并致力于提高能源利用效率,减少对化石燃料的依赖,以减少对环境的不良影响。 国际合作推动实现可持续的废物管理和资源循环利用, 包括减少废物产生、促进废物分类与回收利用,以及采用环境友好的废物处理技术。 国际环境保护强调加强环境教育,提高公众对环境问题的认识与意识,激发公众参与环境保护的热情,
智能交互页面 单击右上方的“创建技能”,进入“创建技能”页面,如图4所示。 输入如下参数的值: 技能名称:技能名称。必须与科大讯飞创建的技能一一对应,如在科大讯飞创建同名技能后,导入技能文件所示。为方便识别和记忆,两边的技能名称可以设置成一样的。 技能标识:技能标识。必须与科大讯飞创建
如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用MetaStudio服务的其它功能。 本章节为您介绍对用户授权的方法,操作流程如示例流程所示。 前提条件 给用户组授权之前,请您了解用户组可以添加的MetaStudio系统策略,并结合实际需求进行选择。
接在控制台中使用。 图4 已上传资产 支持对上传成功的资产,执行如下操作: 重命名资产:单击资产卡片区域的图标,从下拉框中单击“重命名”,对资产进行重命名。 取消激活:资产上传完成后,默认是激活状态,可以单击资产卡片区域的“取消激活”,将资产设置为“未激活”状态。未激活状态的资产在控制台不可用。
服务校验资产主文件与用户创建的文件信息不匹配。 资产冻结说明 资产冻结说明,如表2所示。 表2 资产冻结说明 场景 操作说明 服务冻结租户资产 MetaStudio服务对租户资产内容的风险有一定连带责任。如果服务接收到资产内容投诉,按照国家相关部门要求,会冻结违规违规资产。情节严重的,还会冻结租户的全部资源。
<speak>:此标签为所有文本的根节点。一切需要调用SSML标签的文本,都要包含在<speak> </speak>标记对中。 <emotion>:情感标签,对指定的一或多句话生效。标签开始在句子起始位置,标签结束在句子结尾。用法为:<emotion type="情感标签">,对
大部分相机内置麦克风的录制效果也能满足我们对声音的要求。我们对声音的清晰度可以有适度的妥协,但请务必保证底噪不能太大,且不能有其他人声出现,尤其是被拍摄模特正在说话的时候。 模特形象 分身数字人不支持替换衣服,因此,您在录制时的着装会决定您的数字人穿着。 在拍摄前,我们建议参照如下条目,对您的形象进行检查。
插入贴图 将鼠标放在图片上方,图片右上角展示图标。单击图标,添加至当前场景的视频直播画面中。 在视频直播画面预览区域,如果存在多种视频素材,支持对贴图进行图层管理,如:上移一层、下移一层、置顶、置底、复制、应用到全局、删除等。还支持设置大小,拖动位置。 视频 视频界面详情,如图4所示。
场景操作 支持对场景,执行下述操作: :修改场景名称,默认值为“场景1” :设置当前场景播报的声音,直播时会优先使用此声音播报当前场景内容。 :复制当前场景,新增一个相同场景。 :删除当前场景。 :调整场景的位置。 :为当前场景新增1个空白段落。 段落操作 支持对段落,执行下述操作:
问答对ID为空 问答对ID为空 请携带正确的问答对ID 400 MSS.47010076 sisHotWords参数为空 sisHotWords参数为空 请携带正确的sisHotWords 400 MSS.47010077 热词记录已存在 热词记录已存在 同一region和语种只支持创建一个热词记录
不涉及。 取值范围: 90-240 默认取值: 140 表14 LiveJobLog 参数 参数类型 描述 interaction_records_url String 直播互动记录文件地址 表15 PlatformLiveDetailInfo 参数 参数类型 描述 platform_id
不涉及。 取值范围: 90-240 默认取值: 140 表12 LiveJobLog 参数 参数类型 描述 interaction_records_url String 直播互动记录文件地址 表13 PlatformLiveDetailInfo 参数 参数类型 描述 platform_id
声音的性别,用于匹配声音模型的精准度。 如下所示: 男生 女生 原始输入语言 上传语料所使用的语言。 包含如下语言: 中文 英文 须知:当前参数配置仅作为标识,对训练结果没有任何影响。 选择声音标签 声音的标签。作用为选择声音时,快速筛选领域。 包含如下选项: 新闻 营销 针对上述标签,MetaStu
手部和身体三个区域。 使用深度学习算法,识别面部区域转化为面部表情,识别手部区域转化为手部骨骼驱动数据,识别身体转化为人体骨骼驱动数据。 对算法输出系数进行平滑处理及异常数据过滤,返回结果。 算法应用场景 数字人视觉驱动算法可用于影视制作、虚拟人姿态控制等场景,加速影视制作的动画生成效率,提升虚拟人控制体验。
宾语、日语、意大利语、马来语、俄罗斯语、韩语、芬兰语、荷兰语、西班牙语、印尼语、阿拉伯语、葡萄牙语、泰语。 须知:当前参数配置仅作为标识,对训练结果没有任何影响。 请选择输出模型语言 选择输出的声音模型支持的语言。 支持如下语言: 多语种:输出的声音模型,支持合成的语言类型包括中