搜索_华为云

如何知道是哪个节点是worker呢？ - AI开发平台ModelArts

多节点训练TensorFlow框架ps节点作为server会一直挂着，ModelArts是怎么判定训练任务结束？如何知道是哪个节点是worker呢？ TensorFlow框架分布式训练的情况下，会启动ps与worker任务组，worker任务组为关键任务组，会以worker任务组的进程退出码，判断训练作业是否结束。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
Notebook实例重新启动后，需要删除本地known_hosts才能连接 - AI开发平台ModelArts

Notebook实例重新启动后，需要删除本地known_hosts才能连接可以在本地的ssh config文件中对这个Notebook配置参数“StrictHostKeyChecking no”和“UserKnownHostsFile=/dev/null”，如下参考所示： Host

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code使用技巧
管理Workflow工作流 - AI开发平台ModelArts

工作流运行页面：单击右上角的“启动”按钮，出现启动Workflow询问弹窗，单击“确定”。工作流参数配置页面：单击右上角的“启动”按钮，出现启动Workflow询问弹窗，单击“确定”。启动Workflow后，运行过程中将会按需收费，请关注实例状态，完成后的工作流请及时停止，避免产生不必要的费用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
如何将Ubuntu20.04内核版本从低版本升级至5.4.0-144-generic？ - AI开发平台ModelArts

为5.4.0-144-generic。第二条命令为重新生成GRUB引导程序的配置文件，用于在启动计算机时加载操作系统，命令将使用新安装的内核镜像更新GRUB的配置文件，以便在下次启动时加载新的内核。父主题： Lite Server

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
Notebook里面运行的实例，如果重启，数据集会丢失么？ - AI开发平台ModelArts

ModelArts提供的Notebook实例是以ma-user启动的，用户进入实例后，工作目录默认是“/home/ma-user/work”。创建实例，“/home/ma-user/work”目录下挂载的数据，在实例停止、重新启动后依然保留，其他目录下的内容会还原。父主题： CodeLab

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > CodeLab
用户结束kernelgateway进程后报错Server Connection Error，如何恢复？ - AI开发平台ModelArts

" 2>&1 & chmod 640 ${KERNEL_GATEWAY_LOG_FILE} 执行命令ps -ef检查进程是否启动。图3 检查进程是否启动父主题：环境配置故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
重试/停止/运行Workflow节点 - AI开发平台ModelArts

重试/停止/继续运行Workflow节点重试当单个节点运行失败时，用户可以通过重试按钮重新执行当前节点，无需重新启动工作流。在当前节点的运行状况页面，单击“重试”。在重试之前您也可以前往权限管理页面修改配置，节点重试启动后新修改的配置信息可以在当前执行中立即生效。停止单击指定节点查看详情，可以对运行中的节点进行停止操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
tensorboard显示502 bad gateway - AI开发平台ModelArts

问题现象启动tensorboard后，打开tensorboard提示502 bad gateway，或者偶现502 bad gateway。原因分析出现该问题的可能原因如下: 启动tensorboard对应的summary目录错误，导致tensorboard启动失败。启动

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
如何禁止Ubuntu 20.04内核自动升级？ - AI开发平台ModelArts

如何禁止Ubuntu 20.04内核自动升级？场景描述在Ubuntu 20.04每次内核升级后，系统需要重新启动以加载新内核。如果您已经安装了自动更新功能，则系统将自动下载和安装可用的更新，这可能导致系统在不经意间被重启；如果使用的软件依赖于特定版本的内核，那么当系统自动更新

 帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
创建模型成功后，部署服务报错，如何排查代码问题 - AI开发平台ModelArts

创建模型成功后，部署服务报错，如何排查代码问题问题现象创建模型成功后，部署服务失败，如何定位是模型代码编写有问题。原因分析用户自定义镜像或者通过基础镜像导入的模型时，用户自己编写了很多自定义的业务逻辑，这些逻辑有问题将会导致服务部署或者预测失败，需要能够排查出哪里有问题。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

本文介绍三种使用训练作业来启动PyTorch DDP训练的方法及对应代码示例。使用PyTorch预置框架功能，通过mp.spawn命令启动使用自定义镜像功能通过torch.distributed.launch命令启动通过torch.distributed.run命令启动创建训练作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
报错“ssh: connect to host xxx.pem port xxxxx: Connection refused”如何解决？ - AI开发平台ModelArts

Connection refused”如何解决？问题现象原因分析网络不通；端口不通。解决方法检查实例是否运行。请前往ModelArts控制台查看实例是否处于运行状态，如果实例已停止，请执行启动操作，如果实例处于其他状态比如“错误”，请尝试先执行停止然后执行启动操作。待实例变为“运行中”后，再次执行远程连接。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
报错“ssh: connect to host xxx.pem port xxxxx: Connection refused”如何解决？ - AI开发平台ModelArts

Connection refused”如何解决？问题现象原因分析实例处于非运行状态。解决方法请前往ModelArts控制台查看实例是否处于运行状态，如果实例已停止，请执行启动操作，如果实例处于其他状态比如“错误”，请尝试先执行停止然后执行启动操作。待实例变为“运行中”后，再次执行远程连接。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
管理在线服务生命周期 - AI开发平台ModelArts

管理在线服务生命周期启动服务您可以对处于“运行完成”、“异常”和“停止”状态的服务进行启动操作，“部署中”状态的服务无法启动。启动服务，当服务处于“运行中”状态后，ModelArts将开始计费。您可以通过如下方式启动服务：登录ModelArts管理控制台，在左侧菜单栏中选择

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
管理批量服务生命周期 - AI开发平台ModelArts

管理批量服务生命周期启动服务您可以对处于“运行完成”、“异常”和“停止”状态的服务进行启动操作，“部署中”状态的服务无法启动。启动服务，当服务处于“运行中”状态后，ModelArts将开始计费。您可以通过如下方式启动服务：登录ModelArts管理控制台，在左侧菜单栏中选择

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
服务部署 - AI开发平台ModelArts
服务部署 - AI开发平台ModelArts

部署的在线服务状态为告警服务启动失败服务部署、启动、升级和修改时，拉取镜像失败如何处理？服务部署、启动、升级和修改时，镜像不断重启如何处理？服务部署、启动、升级和修改时，容器健康检查失败如何处理？服务部署、启动、升级和修改时，资源不足如何处理？模型使用CV2包部署在线服务报错

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
或者'Port forwarding is disabled.”如何解决？ - AI开发平台ModelArts

key verification failed.'或者'Port forwarding is disabled.”如何解决？问题现象或原因分析 Notebook实例重新启动后，公钥发生变化，OpenSSH核对公钥发出警告。解决方法在VS Code中使用命令方式进行远程连接时，增加参数"-o

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
或者'Port forwarding is disabled.”如何解决？ - AI开发平台ModelArts

key verification failed.'或者'Port forwarding is disabled.”如何解决？问题现象或原因分析 Notebook实例重新启动后，公钥发生变化，OpenSSH核对公钥发出警告。解决方法在VS Code中使用命令方式进行远程连接时，增加参数"-o

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
新建Workflow Execution - AI开发平台ModelArts

限制条件。表29 WorkflowDagPolicies 参数参数类型描述 use_cache Boolean 是否使用缓存。请求示例启动工作流 POST https://{endpoint}/v2/{project_id}/workflows/{workflow_id}/executions

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
在线服务运行中但是预测失败时，如何排查报错是不是模型原因导致的 - AI开发平台ModelArts

在线服务运行中但是预测失败时，如何排查报错是不是模型原因导致的问题现象在线服务启动后，当在线服务进入到“运行中”状态后，进行预测，预测请求发出后，收到的响应不符合预期，无法判断是不是模型的问题导致的不符合预期。原因分析在线服务启动后，ModelArts提供两种方式的预测：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务

总条数： 1998

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何知道是哪个节点是worker呢？ - AI开发平台ModelArts

Notebook实例重新启动后，需要删除本地known_hosts才能连接 - AI开发平台ModelArts

管理Workflow工作流 - AI开发平台ModelArts

如何将Ubuntu20.04内核版本从低版本升级至5.4.0-144-generic？ - AI开发平台ModelArts

Notebook里面运行的实例，如果重启，数据集会丢失么？ - AI开发平台ModelArts

用户结束kernelgateway进程后报错Server Connection Error，如何恢复？ - AI开发平台ModelArts

重试/停止/运行Workflow节点 - AI开发平台ModelArts

tensorboard显示502 bad gateway - AI开发平台ModelArts

如何禁止Ubuntu 20.04内核自动升级？ - AI开发平台ModelArts

创建模型成功后，部署服务报错，如何排查代码问题 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

报错“ssh: connect to host xxx.pem port xxxxx: Connection refused”如何解决？ - AI开发平台ModelArts

报错“ssh: connect to host xxx.pem port xxxxx: Connection refused”如何解决？ - AI开发平台ModelArts

管理在线服务生命周期 - AI开发平台ModelArts

管理批量服务生命周期 - AI开发平台ModelArts

服务部署 - AI开发平台ModelArts

或者'Port forwarding is disabled.”如何解决？ - AI开发平台ModelArts

或者'Port forwarding is disabled.”如何解决？ - AI开发平台ModelArts

新建Workflow Execution - AI开发平台ModelArts

在线服务运行中但是预测失败时，如何排查报错是不是模型原因导致的 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线