搜索_华为云

使用DCGM监控Lite Server资源 - AI开发平台ModelArts

xx为Grafana的所在宿主机的IP地址图1 Prometheus 在HTTP的URL输入框中输入Prometheus的IP地址和端口号，单击Save&Test：图2 IP地址和端口号至此，指标监控方案安装完成。指标监控效果展示如下：图3 指标监控效果这里使用的是Grafana最基本的功

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
VS Code一键连接Notebook - AI开发平台ModelArts

port xxxxx: Connection refused”如何解决？报错“no such identity: C:/Users/xx /test.pem: No such file or directory”如何解决？报错“Bad owner or permissions on

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

_JOB_DIR}/demo-code”目录中，“demo-code”为存放代码目录的最后一级OBS目录。例如，“代码目录”选择的是“/test/code”，则训练代码文件会被下载到训练容器的“${MA_JOB_DIR}/code”目录中。运行用户ID 容器运行时的用户ID，该

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
eagle投机小模型训练 - AI开发平台ModelArts

文件将数据集转换为share gpt格式。 python convert_to_sharegpt.py \ --input_file_path data_test.json \ --out_file_name ./data_for_sharegpt.json \ --prefix_name instruction

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
eagle 投机小模型训练 - AI开发平台ModelArts

文件将数据集转换为share gpt格式。 python convert_to_sharegpt.py \ --input_file_path data_test.json \ --out_file_name ./data_for_sharegpt.json \ --prefix_name instruction

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

训练作业创建完成后，ModelArts会将代码目录及其子目录下载至训练后台容器中。例如：OBS路径“obs://obs-bucket/training-test/demo-code”作为代码目录，OBS路径下的内容会被自动下载至训练容器的“${MA_JOB_DIR}/demo-code”目录中，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
Open-Sora-Plan1.0基于DevServer适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

Open-Sora-Plan1.0基于DevServer适配PyTorch NPU训练推理指导（6.3.907）本文档主要介绍如何在ModelArts Lite DevServer上，使用PyTorch_npu+华为自研Ascend Snt9B硬件，完成Open-Sora-Plan1

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

信息和镜像解耦，可以在服务部署时配置，不能直接硬编码在Dockerfile中。定期针对镜像进行安全扫描，及时安装补丁修复漏洞。增加健康检查接口，确保健康检查可以正常返回业务状态，便于告警和故障恢复。容器应该采用https的安全传输通道，并使用业界推荐的加密套件保证业务数据的安全性。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
附录：训练常见问题 - AI开发平台ModelArts

XXX not found in your environment: flash_attn 根因：昇腾环境暂时不支持flash_attn接口规避措施：修改dynamic_module_utils.py文件，将180-184行代码注释掉 vim /home/ma-user/an

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）
在ModelArts的Notebook中使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

logits_pattern = model_meta.default_logits_pattern print(logits_pattern) 您也可以通过如下接口，获取MoXing支持的网络名称列表。 import moxing.tensorflow as mox print(help(mox.NetworkKeys))

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
eagle投机小模型训练 - AI开发平台ModelArts

文件将数据集转换为share gpt格式。 python convert_to_sharegpt.py \ --input_file_path data_test.json \ --out_file_name ./data_for_sharegpt.json \ --prefix_name instruction

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910）
模型训练使用流程 - AI开发平台ModelArts

面创建训练作业，创建时基于算法来源和训练框架又区分多种创建方式，具体请参见表2。 ModelArts Standard也支持通过调用API接口创建训练作业，请参见以PyTorch框架创建训练作业。训练作业进阶功能 ModelArts Standard还支持以下训练进阶功能，例如：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
各模型支持的最小卡数和最大序列 - AI开发平台ModelArts

el-len。 e5-mistral-7B和gte-Qwen2-7B-instruct模型，使用openai启动服务，发送推理请求使用的是接口curl -X POST http://localhost:port/v1/embedding。表1 基于vLLM不同模型推理支持最小卡数和最大序列说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 附录
ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

msprobe使用手册性能调优 PyTorch Profiler 性能采集工具，在训练脚本中调用Ascend PyTorch Profiler接口，可在训练过程中采集性能数据文件，包括PyTorch层算子信息、CANN层算子信息、底层NPU算子信息、以及算子内存占用信息等。包含在torch_npu包中。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
准备物体检测数据 - AI开发平台ModelArts

<ymin>100<ymin> <xmax>200<xmax> <ymax>200<ymax> 标注文件示例： <annotation> <folder>test_data</folder> <filename>260730932.jpg</filename> <size>

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

元模型来源：选择“从对象存储服务（OBS）中选择”。选择元模型：从OBS中选择一个模型包。 AI引擎：选择“Custom”。引擎包：从容器镜像中选择一个镜像。容器调用接口：端口和协议可根据镜像实际使用情况自行填写。其他参数保持默认值。单击“立即创建”，跳转到模型列表页，查看模型状态，当状态变为“正常”，模型创建成功。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

异常中文描述检测方法处理建议 NT_NPU_DEVICE NPU 其他 npu dcmi device异常。 NPU设备异常，昇腾dcmi接口中返回设备存在重要或紧急告警。可能是亚健康，建议先重启节点，如果重启节点后未恢复，发起维修流程。 NT_NPU_NET NPU 链路 npu

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
推理精度测试 - AI开发平台ModelArts

fig_pip_str设置对应的代理和pip源，来确保当前代理和pip源可用。精度评测新建一个conda环境，确保之前启动服务为vllm接口，进入到benchmark_eval目录下，执行如下命令。命令中的$work_dir 是benchmark_eval的绝对路径。 conda

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
推理精度测试 - AI开发平台ModelArts

fig_pip_str设置对应的代理和pip源，来确保当前代理和pip源可用。精度评测新建一个conda环境，确保之前启动服务为vllm接口，进入到benchmark_eval目录下，执行如下命令。命令中的$work_dir 是benchmark_eval的绝对路径。 conda

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
使用PyCharm手动连接Notebook - AI开发平台ModelArts

file：存放在本地的云上开发环境私钥文件，即在创建开发环境实例时创建并保存的密钥对文件。单击将连接重命名，可以自定义一个便于识别的名字，单击OK。配置完成后，单击Test Connection测试连通性。选择Yes，显示Successfully connected表示网络可以连通，单击OK。在最下方再单击OK保存配置。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例

总条数： 725

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DCGM监控Lite Server资源 - AI开发平台ModelArts

VS Code一键连接Notebook - AI开发平台ModelArts

已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

eagle投机小模型训练 - AI开发平台ModelArts

eagle 投机小模型训练 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

Open-Sora-Plan1.0基于DevServer适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

安全边界 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

在ModelArts的Notebook中使用MoXing时，如何进行增量训练？ - AI开发平台ModelArts

eagle投机小模型训练 - AI开发平台ModelArts

模型训练使用流程 - AI开发平台ModelArts

各模型支持的最小卡数和最大序列 - AI开发平台ModelArts

ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

准备物体检测数据 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

使用PyCharm手动连接Notebook - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线