检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
开源模型怎么部署? 开源模型的部署需要购买推理单元,具体操作如下: 在AI原生应用引擎的左侧导航栏选择“资产中心”,选择“大模型”页签。 将鼠标光标移至待部署的开源模型卡片上,单击“部署”。 在“创建部署服务”页面,可以查看到需要几个推理单元,单击“购买推理单元资源”。 图1 创建部署服务
应用数据接入周期性任务运行失败 问题描述 应用数据接入时,执行周期性任务,提示运行失败。 处理方法 检查数据文件是否按照要求放在pt_d=****/pt_h的文件夹下面。 父主题: 运营中心
应用数据接入一次性任务运行失败 问题描述 应用数据接入时,执行一次性任务,提示运行失败。 处理方法 应用数据接入时,OBS路径必须填文件夹的路径,不可以填文件的路径,否则将会导致运行失败。 父主题: 运营中心
删除告警任务失败 问题描述 删除告警任务失败,提示某个mppdb表不存在。 处理办法 将该mppdb表手动重建后,再尝试删除告警任务。 父主题: 运维中心监控服务
新增后在任务列表展示该任务。 表1 配置任务参数说明 参数名称 参数说明 服务名称 所在服务名称,不支持修改。 任务名称 设置任务名称,默认以服务名称加下划线开头。 执行集群 选择任务执行集群。 描述 输入任务描述。 步骤二:配置数据来源 在异常检测任务列表,单击任务所在行“操作”列的“数据”。
当算法类型选择固定阈值时,可以预估维度数量。 配置完成后,单击“保存”,弹出任务状态窗口,如图3所示,按照异常检测任务模块生成一个完整的异常检查任务,自动创建训练数据表,并且参数均为默认参数。 图3 任务状态 任务配置完成后该任务会显示在任务列表,单击任务所在行“操作”列的“基础”,单击“字段配置”,参考表5修改基础数据,获取维度值。
使用JOB创建作业任务 创建业务工具并执行脚本 创建定时作业执行脚本 创建定时日志清理作业 创建自动分发文件作业 查看已创建作业清单 导出作业输出或作业日志 父主题: 监控资源和应用
异常检测Judge定时任务失败 KeyError TypeError: not supported between instances of 'str' and 'float' TypeError("Cannot index by location index with a non-integer
配置异常检测任务 快速配置异常检测任务 新增异常检测任务 通过调整模型参数对异常告警调优 父主题: 监控资源和应用
新创建的微调任务显示在任务列表中,任务状态为“待启动”,请参考表4启用任务。 更多操作 创建微调任务完成后,可执行如表4所示的操作。 表4 更多操作 操作 说明 启用任务 在模型微调流水线任务列表中,单击操作列的“启用”,启动微调任务。当任务拥塞时,状态显示为“等待中”,待任务状态变为“运行中”时,表示正在执行微调任务。
在SLB中创建Action任务 在SLB管理台创建action任务,在部署服务的变更管理中关联并执行任务。 创建节点上下线任务 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发 > 负载均衡”。 选择左侧导航栏的“灰度管理 > Action任务”。 单击“创建任务”,配置基本信息,参数说明如表1所示。
模型微调任务一直在等待中是什么原因? 模型微调任务一直在“等待中”状态,表示当前平台资源规格紧张,任务需要进行排队,请耐心等待。 父主题: AI原生应用引擎
在SLB中创建Action任务 在SLB管理台创建action任务,在部署服务的变更管理中关联并执行任务。 创建节点上下线任务 进入AppStage运维中心。 在顶部导航栏选择服务。 单击,选择“微服务开发 > 负载均衡”。 选择左侧导航栏的“灰度管理 > Action任务”。 单击“创建任务”,配置基本信息,参数说明如表1所示。
出、日志或者全部,单击“确定”。 克隆已创建作业 在作业列表中,单击作业所在行“操作”列“更多 > 克隆”。 父主题: 使用JOB创建作业任务
告警后触发知识编排任务提示alert_type不存在 问题描述 部分告警任务告警后触发知识编排任务报错,提示alert_type不存在,可能由于该告警任务从老版本迁移过来,一直没有调整过,其告警结果表中没有该字段,所以会出现这种报错。 处理方法 可以在告警任务“基础”中增加一个空
选择左侧导航栏的“EAP&JOB > 脚本执行 > 我的导出”。 在“我的导出”页面下载并查看导出记录。 父主题: 使用JOB创建作业任务
json,表示训练完成后judge未成功加载训练模型。 解决方法 依次单击“初始化Daemon”、“注册任务”和“启动任务”,重启judge,观察执行结果。 父主题: 异常检测Judge定时任务失败
与告警指标字段一致。 在MPPDB汇聚中新建任务,查询对应指标字段数据是否为空。 确认汇聚任务及上游数据处理环节(数据接入至Kafka的Topic、数据导流至Chickhouse表)是否存在异常。 父主题: 异常检测Judge定时任务失败
null size 问题现象 动态阈值告警任务,judge历史的原始详情中出现too much null size报错。 可能原因 告警原始表中存在大量空值或者表无数据。 解决方法 在MPPDB汇聚中新建任务,查询告警原始表中数据是否正常。 检查汇聚任务及上游数据处理环节(数据接入至Ka
设置为提前3分钟。 查看judge任务汇聚提前时间,一般设置为提前5分钟。 可以适当增加judge任务汇聚提前时间,确保judge能够获取到数据即可。 如果上游任务时延较大,需要联系技术支持工程师协助处理。 父主题: 异常检测Judge定时任务失败