检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建训练作业提示错误码ModelArts.2763 问题现象 创建训练作业时,提示ModelArts.2763 : 选择的支持实例无效,请检查请求中信息的合法性。 原因分析 用户选择的训练规格资源和算法不匹配。 例如:算法支持的是GPU规格,创建训练作业时选择了ASCEND规格的资源类型。
日志提示“Please set the train_url to an empty obs directory” 问题现象 日志提示“Please set the train_url to an empty obs directory”。 原因分析 对于不支持断点训练的模型,如果
PyTorch1.0引擎提示“RuntimeError: std:exception” 问题现象 在使用PyTorch1.0镜像时,必现如下报错: “RuntimeError: std:exception” 原因分析 PyTorch1.0镜像中的libmkldnn软连接与原生torch的冲突,具体可参看文档。
训练作业的日志出现detect failed(昇腾预检失败) 问题现象 训练启动的日志出现如下相关错误: time="2023-05-27T07:07:08Z" level=error msg="detect failed, error: dsmi-checker detect failed
回滚基线泳道组件 已经在灰度泳道验证通过的灰度组件通过组件基线化升级了基线泳道同名组件后,根据实际业务需要,您可以将基线泳道组件版本配置回滚到最近一次基线化前的版本。 回滚后无法恢复。 前提条件 基线泳道组件已完成基线化升级,请参考基线化基线泳道组件。 回滚基线泳道组件 登录ServiceStage控制台。
修改灰度泳道名称标签 灰度泳道创建完成后,您可根据实际业务需要修改泳道的名称、标签。 前提条件 已创建灰度泳道,请参考创建灰度泳道。 灰度泳道下不存在组件。若存在,需全部删除,请参考删除组件。 修改灰度泳道名称标签 登录ServiceStage控制台。 单击“全链路流量控制”。
添加组件环境变量 组件环境变量概述 环境变量是组件运行环境中设定的一个变量,可以在组件部署后升级单个组件版本配置时修改,为应用提供极大的灵活性。 应用组件下设置的环境变量,属于局部环境变量,仅对该应用组件起作用。 如果您在该组件所在的应用下添加了应用环境变量,且应用环境变量的变量
重建、停止或删除训练作业 另存为算法 当您需要修改训练作业的算法时,可以在训练作业详情页面右上角,单击“另存为算法”。 在“创建算法”页面中,会自动填充上一次训练作业的算法参数配置,您可以根据业务需求在原来算法配置基础上进行修改。 订阅算法不支持另存为算法。 重建训练作业 当对创
设置无条件自动重启 背景信息 训练过程中可能会碰到预期外的情况导致训练失败,且无法及时重启训练作业,导致训练周期长,而无条件自动重启可以避免这类问题。无条件自动重启是指当训练作业失败时,不管什么原因系统都会自动重启训练作业,提高训练成功率和提升作业的稳定性。为了避免无效重启浪费算
训练日志失败分析 在ModelArts Standard中训练作业遇到问题时,可首先查看日志,多数场景下的问题可以通过日志报错信息直接定位。 ModelArts Standard提供了训练作业失败定位与分析功能,如果训练作业运行失败,ModelArts会自动识别导致作业失败的原因
OCR服务返回401状态码,表示Token已经过期。建议重新获取Token调用OCR服务。 您的IAM账号的账号名与主账号的账号名一致,为了保证您的资产安全,限制了该账号下的token不可用。建议您新建一个IAM账号(不同名)授权后再进行相关操作。 近期做过更换密码、服务开通或者
密码的,所以要配置登录配置密码。本指南需要设置root和admin密码,先配置账户admin密码,再配置账户root密码,admin账户做平台调测使用,root账户后台调测使用,本次项目不涉及root登录操作。 图1 通过云账号访问边缘节点 需要重新登录admin账户并输入密码:
“授权名称”,保持默认。 设置“仓库授权”。 选择“GitHub”仓库。 “授权方式”选择“OAuth”。 单击“使用OAuth授权”。 阅读了解服务声明后,勾选“我已知晓本服务的源码构建功能收集上述信息,并同意授权对其的收集、使用行为。” 单击“确定”。 输入您的GitHub账号及密码登录GitHub完成身份认证,等待授权完成。
将训练后得到的模型创建为模型,用于部署服务。 从OBS中导入模型文件创建模型:如果您使用常用框架在本地完成模型开发和训练,可以将本地的模型按照模型包规范上传至OBS桶中,从OBS将模型导入至ModelArts中,创建为模型,直接用于部署服务。 从容器镜像中导入模型文件创建模型:针
如何处理虚拟机类型环境下创建和部署组件时遇到ECS错误? 问题描述 在ServiceStage虚拟机类型环境下创建和部署组件时可能会遇到ECS服务不可用问题。 例如,在组件部署时调用ECS接口超时,查看日志详情报错如下: { "statusCode": 500, "jsonBody":
#安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字 父主题: 准备工作
建议把调试过程中的修改点通过Dockerfile固化到容器构建正式流程,并重新测试。 确认对应的脚本、代码、流程在linux服务器上运行正常。 如果在linux服务器上运行就有问题,那么先调通以后再做容器镜像。 确认打入镜像的文件是否在正确的位置、是否有正确的权限。 训练场景主要查看自研的依赖包是否正常,查看pip
所有任务 平台管理员可在所有任务列表页查看所有项目中的子任务。 图1 所有任务 所有任务相关操作 在“所有任务”列表,还可以进行以下操作。 表1 所有任务相关操作 任务 操作步骤 查询任务 在搜索输入框中输入搜索条件,按回车键即可查询。 查看任务详情 单击任务名称,界面跳转至任务详情,可查看任务详情信息。
当前仅支持包年/包月套餐包计费模式,详情请见HiLens端云边协同平台服务计费模式。 技能 在基础版华为HiLens的技能市场购买商用技能时,会收取费用。 当前仅支持包周期计费模式。计费模式请见商用技能计费模式。 HiLens端云边协同平台服务计费模式 HiLens端边云协同平台服务支持包年/包月套餐包计费模式。
当前仅支持包年/包月套餐包计费模式,详情请见HiLens端云边协同平台服务计费模式。 技能 在基础版华为HiLens的技能市场购买商用技能时,会收取费用。 当前仅支持包周期计费模式。计费模式请见商用技能计费模式。 HiLens端云边协同平台服务计费模式 HiLens端边云协同平台服务支持包年/包月套餐包计费模式。