搜索_华为云

在Linux上安装配置Grafana - AI开发平台ModelArts

购买弹性公网IP，并绑定到购买的弹性云服务器ECS上，具体操作请参见《弹性公网IP快速入门》。操作步骤将本地命令复制至ECS服务器请参考如下方法：在ECS桌面单击“复制粘贴”，使用快捷键“Ctrl+V”将命令粘贴至窗口中并单击“发送”，将复制的命令发送至命令行窗口，如下图所示。图3

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标 > 安装配置Grafana
VS Code连接开发环境失败时的排查方法 - AI开发平台ModelArts

Code连接开发环境失败时的排查方法 VS Code连接开发环境失败时，请参考以下步骤进行基础排查。网络链路检查在ModelArts控制台查看Notebook实例状态是否正常，确保实例无问题。在VS Code Terminal里执行如下命令检测SSH命令是否可用； ssh -i

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
构建Workflow多分支运行场景 - AI开发平台ModelArts

构建Workflow多分支运行场景 Workflow多分支运行介绍构建条件节点控制分支执行配置节点参数控制分支执行配置多分支节点数据父主题：开发Workflow命令参考

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
VS Code连接开发环境失败时的排查方法 - AI开发平台ModelArts

Code连接开发环境失败时的排查方法 VS Code连接开发环境失败时，请参考以下步骤进行基础排查。网络链路检查在ModelArts控制台查看Notebook实例状态是否正常，确保实例无问题。在VS Code Terminal里执行如下命令检测SSH命令是否可用； ssh -i

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
创建Workflow服务部署节点 - AI开发平台ModelArts

nput的列表 outputs 服务部署节点的输出列表是 ServiceOutput或者ServiceOutput的列表 title title信息，主要用于前端的名称展示否 str description 服务部署节点的描述信息否 str policy 节点执行的policy

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
查看日志和性能 - AI开发平台ModelArts

查看日志和性能查看日志若查看启动作业日志信息，可通过以下命令打印正在启动的日志信息。其中${pod_name}为pod信息中的NAME，例如vcjob-main-0。 kubectl logs -f ${pod_name} 训练过程中，训练日志会在最后的Rank节点打印。图1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.910）
查看日志和性能 - AI开发平台ModelArts

查看日志和性能查看日志若查看启动作业日志信息，可通过以下命令打印正在启动的日志信息。其中${pod_name}为pod信息中的NAME，例如vcjob-main-0。 kubectl logs -f ${pod_name} 训练过程中，训练日志会在最后的Rank节点打印。图1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909）
创建Workflow训练作业节点 - AI开发平台ModelArts

spec 作业使用的资源规格相关配置是 JobSpec inputs 作业节点的输入列表是 JobInput或者JobInput的列表 outputs 作业节点的输出列表是 JobOutput或者JobOutput的列表 title title信息，主要用于前端的名称展示否 str

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

静态shape模型转换转换静态shape模型需要在模型转换阶段固定模型的输入shape，也就是说每个输入shape是唯一的。静态shape转换主要包括两种场景：第一种是待转换onnx模型的输入本身已经是静态shape，此时不需要在转换时指定输入shape也能够正常转换为和onnx模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

0”更换为“NVIDIA 515+CUDA 11.7”。操作步骤卸载原有版本的NVIDIA和CUDA。查看使用apt包管理方式安装的nvidia软件包，执行如下命令实现查看和卸载。 dpkg -l | grep nvidia dpkg -l | grep cuda sudo apt-get autoremove

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
请求超时返回Timeout - AI开发平台ModelArts

优先排查APIG（API网关）是否是通的，可以在本地使用curl命令排查，命令行：curl -kv {预测地址}。如返回Timeout则需排查本地防火墙，代理和网络配置。检查模型是否启动成功或者模型处理单个消息的时长。因APIG（API网关）的限制，模型单次预测的时间不能超过40S，超过后系统会默认返回Timeout错误。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

个组织。创建组织的详细操作请参见创建组织。同一个组织内的用户可以共享使用该组织内的所有镜像。镜像会以快照的形式保存，保存过程约5分钟，请耐心等待。此时不可再操作实例（对于打开的JupyterLab界面和本地IDE仍可操作）。快照中耗费的时间仍占用实例的总运行时长，如果在快照

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
创建Workflow模型注册节点 - AI开发平台ModelArts

使用多输入项的模板创建模型时，如果模板定义的目标路径input_properties是一样的，则此处输入的obs目录或者obs文件不能重名，否则会覆盖。是 str、Placeholder、Storage 使用案例主要包含六种场景的用例：基于JobStep的输出注册模型基于OBS数据注册模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
查看ModelArts模型详情 - AI开发平台ModelArts

参数配置可以查看模型的apis定义详情，以及模型的入参和出参。运行时依赖查看模型对环境的依赖。当构建任务失败后可以编辑运行时依赖，保存修改后将触发镜像重新构建。事件展示模型创建过程中的关键操作进展。事件保存周期为3个月，3个月后自动清理数据。查看模型的事件类型和事件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
run.sh脚本测试ModelArts训练整体流程 - AI开发平台ModelArts

自定义容器在ModelArts上训练和本地训练的区别如下图：图1 本地与ModelArts上训练对比 ModelArts上进行训练比本地训练多了一步OBS和容器环境的数据迁移工作。增加了和OBS交互工作的整个训练流程如下：建议使用OBSutil作为和OBS交互的工具，如何在本机安装obsutil可以参考obsutil安装和配置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
训练输出的日志只保留3位有效数字，是否支持更改loss值？ - AI开发平台ModelArts

训练输出的日志只保留3位有效数字，是否支持更改loss值？在训练作业中，训练输出的日志只保留3位有效数字，当loss过小的时候，显示为0.000。具体日志如下： INFO:tensorflow:global_step/sec: 0.382191 INFO:tensorflow:step:

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 查看作业详情
训练精度测试 - AI开发平台ModelArts

客户使用工具自带精度基线Yaml则需使用accuracy_cfgs.yaml文件中默认配置，权重使用表1 模型权重中指定的Huggingface地址，数据指定data.tgz里面提供的gsm8k数据。查看精度结果任务完成之后会在test-benchmark目录下生成excel表格：精度结果 LLa

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
安装VS Code软件 - AI开发平台ModelArts

安装VS Code软件 VS Code下载方式：下载地址: https://code.visualstudio.com/updates/v1_85 图1 VS Code的下载位置 VS Code版本要求：建议用户使用VS Code 1.85.2版本进行远程连接。 VS Code安装指导如下：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
训练好的模型是否可以下载或迁移到其他账号？如何获取下载路径？ - AI开发平台ModelArts

在训练作业列表中，单击目标训练作业名称，查看该作业的详情。在左侧获取“输出位置”下的路径，即为训练模型的下载路径。模型迁移到其他账号您可以通过如下两种方式将训练的模型迁移到其他账号。将训练好的模型下载至本地后，上传至目标账号对应区域的OBS桶中。通过对模型存储的目标文件夹或者目标桶配置

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 查看作业详情
LoRA微调训练 - AI开发平台ModelArts

训练脚本中会自动执行训练前的权重转换操作和数据处理操作。如果想详细了解脚本执行训练权重转换操作和数据集预处理操作说明请分别参见训练中的权重转换说明和训练的数据集预处理说明。步骤二修改训练超参配置以Llama2-70b和Llama2-13b的LoRA微调为例，执行脚本为0_pl_lora_70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.910）

总条数： 1587

上一页
1
...
5
6
7
...
80
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Linux上安装配置Grafana - AI开发平台ModelArts

VS Code连接开发环境失败时的排查方法 - AI开发平台ModelArts

构建Workflow多分支运行场景 - AI开发平台ModelArts

VS Code连接开发环境失败时的排查方法 - AI开发平台ModelArts

创建Workflow服务部署节点 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

创建Workflow训练作业节点 - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

请求超时返回Timeout - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

创建Workflow模型注册节点 - AI开发平台ModelArts

查看ModelArts模型详情 - AI开发平台ModelArts

run.sh脚本测试ModelArts训练整体流程 - AI开发平台ModelArts

训练输出的日志只保留3位有效数字，是否支持更改loss值？ - AI开发平台ModelArts

训练精度测试 - AI开发平台ModelArts

安装VS Code软件 - AI开发平台ModelArts

训练好的模型是否可以下载或迁移到其他账号？如何获取下载路径？ - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线