搜索_华为云

场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Turbo文件系统联动，可以实现灵活数据管理、高性能读取等。约束限制如果要使用自动重启功能，资源规格必须选择八卡规格。适配的CANN版本是cann_8.0.rc3，驱动版本是23.0.6。本案例仅支持在专属资源池上运行，确保专属资源池可以访问公网。文档更新内容 6.3.909版本相对于6.3.908版本新增如下内容：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.909）
Standard资源池节点故障定位 - AI开发平台ModelArts

L2: 不可纠正ECC错误（多比特ECC错误），当次业务受损，重启进程可恢复。观测方式：nvidia-smi -a中查询到Volatile Uncorrectable记录。 L3: 错误未被抑制，可能影响后续业务，需要重置卡或重启节点。观测方式：Xid事件中包含95事件。(Remapp

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
场景描述 - AI开发平台ModelArts
场景描述 - AI开发平台ModelArts

CommonOperations没有任何专属资源池的创建、更新、删除权限，只有使用权限。推荐给子账号配置此权限。 ModelArts CommonOperations 必选如果需要给子账号开通专属资源池的创建、更新、删除权限，此处要勾选ModelArts FullAccess，请谨慎配置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

约束限制如果要使用自动重启功能，资源规格必须选择八卡规格，只有llama3-8B/70B支持该功能。适配的CANN版本是cann_8.0.rc3，驱动版本是23.0.6。本案例仅支持在专属资源池上运行，确保专属资源池可以访问公网。文档更新内容 6.3.909版本相对于6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909）
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

安装固件，安装完后需要reboot重启机器。 chmod 700 *.run # 注意替换成实际的包名 ./Ascend-hdk-型号-npu-firmware_版本号.run --full reboot 安装驱动，提示处输入“y”，安装完后直接生效不用重启机器。 # 注意替换成实际的包名

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

步目录，默认为/home/ma-user/work/project名称，可根据自己实际情况更改。单击“Apply”，配置完成后，重启IDE生效。重启后初次进行update python interpreter需要耗费20分钟左右。 Step5 使用插件连接云上Notebook

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

新版本下载失败。在KeyPair中选择该Notebook实例对应的密钥，选择完成后，单击Apply进行远程Notebook一键配置，等待一段时间后，会出现重启IDE的确认框，单击确认重启，重启后即可生效。图13 ToolKit连接Notebook配置界面 KeyPair: 需

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
升级模型服务 - AI开发平台ModelArts

升级模型服务在AI开发过程中，服务升级包括对已部署的模型服务进行优化，以提高性能、增加功能、修复缺陷，并适应新的业务需求。更新模型版本作为服务升级的一部分，涉及用新训练的模型版本替换原来的模型，以提高预测的准确性和模型的环境适应性。登录ModelArts管理控制台。在左侧导航栏中，选择“ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

取相关信息，存在锁死的风险。出现D+进程后可以尝试如下方法：方法1：可以根据ps -aux查到的进程号，使用kill -9强制关闭进程。 sudo kill -9 <进程ID> 方法2：如果方法1执行后无法消除D+进程，请尝试重启服务器。父主题： Lite Server

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
部署推理服务 - AI开发平台ModelArts

否 16 Int 每个输出序列要生成的最大tokens数量。 top_k 否 -1 Int 控制要考虑的前几个tokens的数量的整数。设置为-1表示考虑所有tokens。适当降低该值可以减少采样时间。 top_p 否 1.0 Float 控制要考虑的前几个tokens的累积概率的浮点数。必须在

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）
管理开发环境实例 - AI开发平台ModelArts

管理开发环境实例功能介绍该接口用于启动、停止、重启、排队、取消排队开发环境Notebook实例。 URI POST /v1/{project_id}/demanager/instances/{instance_id}/action 参数说明如表1所示。表1 参数说明参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

作请参考GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML。若遇到加载到内核的nvidia进程循环依赖，无法从内核中卸载nvidia，此时执行reboot命令重启服务器即可。安装NVIDIA-515和CUDA-11

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
执行微调训练任务 - AI开发平台ModelArts

alpaca_en_demo dpo dataset: dpo_en_demo 是否使用chatglm4-9b、falcon-11b模型。是，更新配置或命令。 chatglm4-9b，更新transformers为4.41.2版本。 pip install transformers==4.41.2 fal

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908）
查看在线服务的事件 - AI开发平台ModelArts

Error message: %s 请根据错误信息定位和处理问题。异常更新服务失败，执行回滚操作。 Failed to update service, rollback it. 请联系技术支持。正常服务更新中。 Updating service. - 正常服务启动中。 Starting

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
查看批量服务的事件 - AI开发平台ModelArts

Error message: %s 请根据错误信息定位和处理问题。异常更新服务失败，执行回滚操作。 Failed to update service, rollback it. 请联系技术支持。正常服务更新中。 Updating service. - 正常服务启动中。 Starting

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
在Notebook上安装配置Grafana - AI开发平台ModelArts

镜像会以快照的形式保存，保存过程约5分钟，请耐心等待。此时不可再操作实例。镜像保存成功后，实例状态变为“运行中”，重启Notebook实例。打开Grafana页面。新打开一个浏览器窗口，在地址栏输入3中配置的root_url后。出现Grafana登录页面即代表在Notebook中安装和配置Gr

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标 > 安装配置Grafana
查看ModelArts模型详情 - AI开发平台ModelArts

一个版本的配置信息，您可以对参数配置进行修改。删除：删除对应的模型。说明：如果模型的版本已经部署服务，需先删除关联的服务后再执行删除操作。模型删除后不可恢复，请谨慎操作。单击模型的“版本数量”，可查看版本列表信息。图1 版本列表版本列表中包含以下信息。表2 版本列表

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

之间的整数。在服务启动阶段，当健康检查请求连续失败达到所填次数后，服务会进入异常状态；在服务运行阶段，当健康检查请求连续失败达到所填次数后，服务会进入告警状态。说明：当模型配置了健康检查，部署的服务在收到停止指令后，会延后3分钟才停止。 “模型说明” 为了帮助其他模型开发者更

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
执行训练任务【旧】 - AI开发平台ModelArts

ckpoint。如果要使用自动重启功能，资源规格必须选择八卡规格。训练作业中的训练故障自动恢复功能包括：训练容错检查（自动重启），帮助用户隔离故障节点，优化用户训练体验。详细可了解：训练容错检查无条件自动重启，不管什么原因系统都会自动重启训练作业，提高训练成功率和提升作业的稳定性。详细可了解：无条件自动重启。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

为例。 “类型”：推荐选择GPU。 “规格”：推荐选择GP Tnt004规格，如果没有再选择其他规格。参数填写完成后，单击“立即创建”进行规格确认。参数确认无误后，单击“提交”，完成Notebook的创建操作。进入Notebook列表，正在创建中的Notebook状态为“创建

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理

总条数： 638

上一页
1
...
7
8
9
...
32
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

场景介绍 - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

场景描述 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

升级模型服务 - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

管理开发环境实例 - AI开发平台ModelArts

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

执行微调训练任务 - AI开发平台ModelArts

查看在线服务的事件 - AI开发平台ModelArts

查看批量服务的事件 - AI开发平台ModelArts

在Notebook上安装配置Grafana - AI开发平台ModelArts

查看ModelArts模型详情 - AI开发平台ModelArts

从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

执行训练任务【旧】 - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线