搜索_华为云

创建Notebook失败，查看事件显示JupyterProcessKilled - AI开发平台ModelArts

创建Notebook失败，查看事件显示JupyterProcessKilled 问题现象创建Notebook失败，查看事件显示JupyterProcessKilled。图1 查看事件原因分析出现此故障是因为Jupyter进程被清理掉了，一般情况Notebook会自动重启的，如果没有自动

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
包年/包月转按需 - AI开发平台ModelArts

调整到期策略”。在弹出的“调整到期策略”页面，确认无误后单击“确定”。图1 调整到期策略进入“费用中心 > 续费管理”页面。自定义查询条件。可在“到期转按需项”页签查询已经设置到期转按需的资源。可对“手动续费项”、“自动续费项”、“到期不续费项”页签的资源设置到期转按需的操作。设置包年/包月资源到期后转按需。

帮助中心 > AI开发平台ModelArts > 计费说明 > 变更计费模式
获取训练作业支持的公共规格 - AI开发平台ModelArts

参数类型描述 flavor_id String 资源规格的ID。 flavor_name String 资源规格的名称。 max_num Integer 资源规格的最大节点数。 flavor_type String 资源规格的类型。可选值如下： CPU GPU Ascend billing

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
服务管理 - AI开发平台ModelArts
服务管理 - AI开发平台ModelArts

服务管理服务管理概述在开发环境中部署本地服务进行调试部署在线服务查询服务详情推理服务测试查询服务列表查询服务对象列表更新服务配置查询服务监控信息查询服务日志删除服务

 帮助中心 > AI开发平台ModelArts > SDK参考
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Lite Cluster上的训练方案。训练框架使用的是ModelLink。本方案目前仅适用于企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。约束限制本文档适配昇腾云ModelArts 6.3.909版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909）
创建训练任务 - AI开发平台ModelArts

创建训练任务登录ModelArts管理控制台，检查当前帐号是否已完成访问授权的配置。如果未完成，请参考使用委托授权针对之前使用访问密钥授权的用户，建议清空授权，然后使用委托进行授权。在左侧导航栏中选择“模型训练 > 训练作业”，默认进入“训练作业”列表。单击“创建训练作业”进入创建训练作业页面。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
旧版训练迁移至新版训练需要注意哪些问题？ - AI开发平台ModelArts

新版训练支持使用“自定义算法”、“我的算法”、“我的订阅”方式来创建训练作业。新版训练的创建方式有了更明确的类别划分，选择方式和旧版训练存在区别。旧版中使用“算法管理”中已保存的算法创建训练作业的用户，可以在新版训练中使用“我的算法”创建训练作业。旧版中使用“算法管理”中订阅的算法创建训练作业的用户，可

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
开发用于自定义镜像训练的代码 - AI开发平台ModelArts

json文件中的status字段的值在训练脚本启动时，并不一定为completed状态。因此需要训练脚本等待status字段的值等于completed之后，再去读取文件的剩余内容。通过训练脚本，可以使用模板一格式的jobstart_hccl.json文件，在等待status字段的值等于

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
训练作业的自定义镜像制作流程 - AI开发平台ModelArts

nd）训练框架的自定义镜像约束推荐自定义镜像使用ubuntu-18.04的操作系统，避免出现版本不兼容的问题。自定义镜像的大小推荐15GB以内，最大不要超过资源池的容器引擎空间大小的一半。镜像过大会直接影响训练作业的启动时间。 ModelArts公共资源池的容器引擎空间为5

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

ler对训练数据的拼接和推理prompt的构造等说明。训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908）
安装配置Grafana - AI开发平台ModelArts

在Windows上安装配置Grafana 在Linux上安装配置Grafana 在Notebook上安装配置Grafana 父主题：使用Grafana查看AOM中的监控指标

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标
在Notebook中如何查看GPU使用情况 - AI开发平台ModelArts

在Notebook中如何查看GPU使用情况创建Notebook时，当您选择的类型为GPU时，查看GPU使用情况具体操作如下：登录ModelArts管理控制台，选择“开发空间>Notebook”。在Notebook列表中，单击目标Notebook“操作”列的“打开”，进入“Jupyter”开发页面。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
Ascend上如何查看实时性能指标？ - AI开发平台ModelArts

Ascend上如何查看实时性能指标？ Ascend芯片上查看实时性能指标：npu-smi info，类似GPU的nvidia-smi。父主题：更多功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
MoXing常用操作的样例代码 - AI开发平台ModelArts

在，则直接追加。当被追加的源文件比较大时，例如“obs://bucket_name/obs_file.txt”文件大小超过5MB时，追加一个OBS文件的性能比较低。如果以写入模式或追加模式打开文件，当调用write方法时，待写入内容只是暂时的被存在的缓冲区，直到关闭文件对象（

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Standard运行的，需要购买并开通ModelArts专属资源池和OBS桶。准备数据准备训练数据，可以用本案使用的数据集，也可以使用自己准备的数据集。准备权重准备所需的权重文件。准备代码准备AscendSpeed训练代码。准备镜像准备训练模型适用的容器镜像。准备Notebook

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
使用SDK如何查看旧版专属资源池列表？ - AI开发平台ModelArts

使用SDK如何查看旧版专属资源池列表？可参考如下代码查看旧版专属资源池列表： from modelarts.session import Session from modelarts.estimator import Estimator algo_info = Estimato

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Lite Server上的预训练和全量微调方案。训练框架使用的是ModelLink。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。约束限制本文档适配昇腾云ModelArts 6.3.909版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909）
查看训练作业资源占用情况 - AI开发平台ModelArts

查看训练作业资源占用情况如何查看训练作业资源使用详情在ModelArts管理控制台的左侧导航栏中选择“模型训练 > 训练作业”。在训练作业列表中，单击作业名称进入训练作业详情页面。在训练作业详情页面，单击“资源占用情况”页签查看计算节点的资源使用情况，最多可显示最近三天的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Standard运行的，需要购买并开通ModelArts专属资源池和OBS桶。准备数据准备训练数据，可以用本案使用的数据集，也可以使用自己准备的数据集。准备权重准备所需的权重文件。准备代码准备AscendSpeed训练代码。准备镜像准备训练模型适用的容器镜像。准备Notebook

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
镜像保存时报错“BuildImage,True,Commit successfully|PushImage,False,Task is running.” - AI开发平台ModelArts

镜像过大Push任务一直在运行，或实例节点有问题。解决方法以对应租户的华为云账号登录SWR服务，查看镜像是否已经Push成功。如果Push成功，请重新注册镜像。如果未Push成功，联系SRE查看对应实例的节点是否有问题。父主题：自定义镜像故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障

总条数： 1793

上一页
1
...
57
58
59
...
90
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建Notebook失败，查看事件显示JupyterProcessKilled - AI开发平台ModelArts

包年/包月转按需 - AI开发平台ModelArts

获取训练作业支持的公共规格 - AI开发平台ModelArts

服务管理 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

旧版训练迁移至新版训练需要注意哪些问题？ - AI开发平台ModelArts

开发用于自定义镜像训练的代码 - AI开发平台ModelArts

训练作业的自定义镜像制作流程 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

安装配置Grafana - AI开发平台ModelArts

在Notebook中如何查看GPU使用情况 - AI开发平台ModelArts

Ascend上如何查看实时性能指标？ - AI开发平台ModelArts

MoXing常用操作的样例代码 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

使用SDK如何查看旧版专属资源池列表？ - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

查看训练作业资源占用情况 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

镜像保存时报错“BuildImage,True,Commit successfully|PushImage,False,Task is running.” - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线