搜索_华为云

创建Notebook失败，查看事件显示JupyterProcessKilled - AI开发平台ModelArts

创建Notebook失败，查看事件显示JupyterProcessKilled 问题现象创建Notebook失败，查看事件显示JupyterProcessKilled。图1 查看事件原因分析出现此故障是因为Jupyter进程被清理掉了，一般情况Notebook会自动重启的

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
权限管理 - AI开发平台ModelArts
权限管理 - AI开发平台ModelArts

至此，您应该已经发现了一个细节，ModelArts在使用委托时，是将其与用户进行关联的，用户与委托的关系是多对1的关系。这意味着，如果两个用户需要配置的委托一致，那么不需要为每个用户都创建一个独立的委托项，只需要将两个用户都“指向”同一个委托项即可。图2 用户与委托对应关系每个用户必须关联委托才可以使用

 帮助中心 > AI开发平台ModelArts > 产品介绍
在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

脚本中添加收集Summary相关代码。 TensorFlow引擎的训练脚本中添加Summary代码，具体方式请参见TensorFlow官方网站。注意事项运行中的可视化作业不单独计费，当停止Notebook实例时，计费停止。 Summary文件数据如果存放在OBS中，由OBS单

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
删除可视化作业 - AI开发平台ModelArts

删除可视化作业功能介绍删除可视化作业。此接口为异步接口，作业状态请通过查询可视化作业列表与查询可视化作业详情接口获取。 URI DELETE /v1/{project_id}/visualization-jobs/{job_id} 参数说明如表1所示。表1 参数说明参数是否为必选

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

参数类型描述 id 否 Integer 算法uuid，创建算法时无需填写。 name 是 String 算法名称。限制为1-64位只含数字、字母、下划线和中划线的名称。 description 否 String 对算法的描述，默认为“NULL”，字符串的长度限制为[0, 256]。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
停止可视化作业 - AI开发平台ModelArts

停止可视化作业功能介绍停止可视化作业。此接口为异步接口，作业状态请通过查询可视化作业列表与查询可视化作业详情接口获取。 URI POST /v1/{project_id}/visualization-jobs/{job_id}/stop 参数说明如表1所示。表1 参数说明参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
附录：rank_table_file.json文件 - AI开发平台ModelArts

-g; done server_id：当前Server节点的IP地址，涉及4台机器。 container_ip：容器IP地址，无特殊配置时与server_id保存一致。 { "server_count": "4", "server_list": [

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
创建可视化作业 - AI开发平台ModelArts

String 用户项目ID。获取方法请参见获取项目ID和名称。请求消息请求参数如表2所示。表2 请求参数参数是否必选参数类型说明 job_name 是 String 可视化作业名称。限制为1-20位只含数字，字母，下划线，中划线的名称。 job_desc 否 String 对可

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
LoRA微调训练 - AI开发平台ModelArts

LoRA微调训练前提条件已上传训练代码、训练权重文件和数据集到OBS中，具体参考代码上传至OBS。 Step1 创建训练任务创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及选择上传的镜像。图1 创建训练作业训练作业启动命令中输入： cd /home/ma-user/work/Qwen-VL;

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

TensorFlow Serving是一个灵活、高性能的机器学习模型部署系统，提供模型版本管理、服务回滚等能力。通过配置模型路径、模型端口、模型名称等参数，原生TFServing镜像可以快速启动提供服务，并支持gRPC和HTTP Restful API的访问方式。 Triton是一个高

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

在展开的版本列表中，单击“部署 > 在线服务”跳转至部署页面。图2 部署模型在部署页面，参考如下说明填写关键参数。 “名称”：自定义一个在线服务的名称，也可以使用默认值，此处以“商超商品识别服务”为例。 “资源池”：选择“公共资源池”。 “模型来源”和“选择模型及版本”：会自动选择订阅模型。

帮助中心 > AI开发平台ModelArts > 快速入门
在ModelArts的Notebook中使用不同的资源规格训练时为什么训练速度差不多？ - AI开发平台ModelArts

在ModelArts的Notebook中使用不同的资源规格训练时为什么训练速度差不多？如果用户的代码中训练任务是单进程的，使用Notebook 8核64GB，72核512GB训练的速度是基本一致的，例如用户用的是2核4GB的资源，使用4核8GB，或者8核64GB效果是一样的。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
发布数据 - AI开发平台ModelArts
发布数据 - AI开发平台ModelArts

息。图1 发布数据集（ModelArts）表1 参数说明（ModelArts）参数说明资产标题在AI Gallery显示的资产名称，建议按照您的目的设置。来源选择“ModelArts”。单个数据集最多支持20000个文件，总大小不超过30G。 ModelArts区域

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

支持在线推理、批量推理、边缘推理多形态部署。 AI工程化能力，支持AI全流程生命周期管理支持MLOps能力，提供数据诊断、模型监测等分析能力，训练智能日志分析与诊断。容错能力强，故障恢复快提供机柜、节点、加速卡、任务多场景故障感知和检测。提供节点级、作业级、容器级，多级故障恢复，保障千卡作业稳定训练。

帮助中心 > AI开发平台ModelArts > 产品介绍
msprobe精度分析工具使用指导 - AI开发平台ModelArts

opout等操作的，目的是在网络阶段引入一定的随机性使得训练结果更加具有鲁棒性。然而在精度对齐阶段，这些随机性会导致训练运行结果每次表现不一致，无法进行和标杆的比对。因此在训练模型复现问题时，需要固定存在随机性的步骤，保证实验可重复性。存在随机性的步骤包括模型参数初始化，数据Ba

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
SD1.5基于Lite Server适配PyTorch NPU Finetune训练指导（6.3.904） - AI开发平台ModelArts

ite Server资源和Ascend Snt9B。表1 环境要求名称版本 CANN cann_8.0.rc1 PyTorch pytorch_2.1.0 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 ascendcloud-aigc-6.3.904-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
迁移效果校验 - AI开发平台ModelArts

迁移效果校验在pipeline适配完成后，需要验证适配后的效果是否满足要求，通过对比原始onnx pipeline的最终输出结果确认迁移效果。如果精度和性能都没有问题，则代表迁移完成。对比图片生成效果在CPU上推理onnx，将原始onnx和适配完成的MindSpore Lite

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
哪里可以了解Atlas800训练服务器硬件相关内容 - AI开发平台ModelArts

询LLDP信息等。 Atlas 800训练服务器备件查询助手备件查询助手可以帮助您查询服务器的所有部件、规格描述，数量等详细信息。打开网站后请输入SN编码“2102313LNR10P5100077”，若失效可以提工单至华为云ModelArts查询。 Atlas 800训练服务器的网卡配置问题

 帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
监控资源 - AI开发平台ModelArts
监控资源 - AI开发平台ModelArts

最近三天的数据。在资源占用情况窗口打开时，会定期向后台获取最新的资源使用率数据并刷新。操作一：如果训练作业使用多个计算节点，可以通过实例名称的下拉框切换节点。操作二：单击图例“cpuUsage”、“gpuMemUsage”、“gpuUtil”、“memUsage”“npuMe

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
创建训练任务 - AI开发平台ModelArts

创建训练任务针对专属池场景，应注意挂载的目录设置和调试时一致。登录ModelArts管理控制台，检查当前账号是否已完成访问授权的配置。如果未完成，请参考使用委托授权。针对之前使用访问密钥授权的用户，建议清空授权，然后使用委托进行授权。在左侧导航栏中选择“模型训练 > 训练作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡

总条数： 1229

上一页
1
...
4
5
6
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建Notebook失败，查看事件显示JupyterProcessKilled - AI开发平台ModelArts

权限管理 - AI开发平台ModelArts

在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

删除可视化作业 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

停止可视化作业 - AI开发平台ModelArts

附录：rank_table_file.json文件 - AI开发平台ModelArts

创建可视化作业 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

在ModelArts的Notebook中使用不同的资源规格训练时为什么训练速度差不多？ - AI开发平台ModelArts

发布数据 - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

msprobe精度分析工具使用指导 - AI开发平台ModelArts

SD1.5基于Lite Server适配PyTorch NPU Finetune训练指导（6.3.904） - AI开发平台ModelArts

迁移效果校验 - AI开发平台ModelArts

哪里可以了解Atlas800训练服务器硬件相关内容 - AI开发平台ModelArts

监控资源 - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线