搜索_华为云

安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

使用从训练或者从OBS中选择创建AI应用，推荐用户使用动态加载的方式导入，动态加载实现了模型和镜像的解耦，便于进行模型资产的保护。用户需要及时更新AI应用的相关依赖包，解决开源或者第三方包的漏洞。AI应用相关的敏感信息，需要解耦开，在“在线服务”部署时进行相应配置。请选择ModelArts推荐的运行时环境，旧的运

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
Lite Cluster资源配置流程 - AI开发平台ModelArts

训练任务大概会运行两小时左右，训练完成后自动停止。若想停止训练任务，可执行下述命令关闭进程，查询进程后显示已无运行中python进程。 pkill -9 python ps -ef 图16 关闭训练进程父主题： Lite Cluster资源配置

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
NPU日志收集上传 - AI开发平台ModelArts

canonicalized_resource = "/%s/%s/%s" % (obs_bucket, self.obs_dir, log_tar) IS_PYTHON2 = sys.version_info.major == 2 or sys.version < '3' canonical_string

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
日志提示"Permission denied" - AI开发平台ModelArts

可能原因是用户使用的启动脚本为旧版本的run_train.sh，脚本里面有某些环境变量在新版本下发的作业中并不存在这些环境变量导致。可能原因是使用Python file接口并发读写同一文件。处理方法对挂载盘的数据加权限，可以改为与训练容器内相同的用户组（1000），假如/nas盘是挂载路径，执行如下代码。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
使用Notebook进行代码调试 - AI开发平台ModelArts

目录。 cd /data/demo 执行训练命令： /home/ma-user/anaconda3/envs/pytorch/bin/python main.py -a resnet50 -b 128 --epochs 5 dog_cat_1w/ 告警"RequestsDependencyWarning:

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
查询AI应用详情 - AI开发平台ModelArts

"model_name" : "mnist", "model_version" : "1.0.0", "runtime" : "python2.7", "tenant" : "6d28e85aa78b4e1a9b4bd83501bcd4a1", "project" :

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
SDXL WebUI基于DevServer适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

altair antlr4-python3-runtime==4.8.0 ftfy regex pytorch_lightning==1.6.5 gitdb trampoline clip aenum facexlib torch==2.1.0 python-multipart gdown

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

semantic_version gitdb trampoline clip aenum facexlib torch==2.1.0 python-multipart gdown \ && pip install -r requirements_versions.txt &&

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
旧版训练迁移至新版训练需要注意哪些问题？ - AI开发平台ModelArts

train_url) 新旧版训练预置引擎差异新版的预置训练引擎默认安装Moxing2.0.0及以上版本。新版的预置训练引擎统一使用了Python3.7及以上版本。新版镜像修改了默认的HOME目录，由“/home/work”变为“/home/ma-user”，请注意识别训练代码

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

载完成后，镜像的启动命令会被自动执行。启动命令的填写规范如下：如果训练启动脚本用的是py文件，例如train.py，运行命令可以写为python ${MA_JOB_DIR}/demo-code/train.py。如果训练启动脚本用的是sh文件，例如main.sh，运行命令可以写为bash

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

sh 在/home/ma-user目录下已经存在infer_server.py脚本文件，启动infer_server.py命令如下。 python infer_server.py 图3 启动脚本在宿主机上另外打开一个终端，使用curl命令发送请求。完整的请求参数请参考表2。 curl

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
查询训练作业版本详情 - AI开发平台ModelArts

"engine_name": "TensorFlow", "engine_id": 1, "engine_version": "TF-1.4.0-python2.7", "status": 10, "app_url": "/usr/app/", "boot_file_url":

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
查询训练作业版本列表 - AI开发平台ModelArts

"engine_id": 1, "engine_version": "TF-1.4.0-python2.7", "status": 10, "app_url": "/usr/app/",

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
模型的自定义镜像制作流程 - AI开发平台ModelArts

ockerfile配置如下： CMD ["sh", "/home/run.sh"] 镜像依赖组件如果需要部署批量服务，镜像内需要集成python、jre/jdk、zip等组件包。（可选）保持Http长链接，无损滚动升级如果需要支持滚动升级的过程中不中断业务，那么需要将服务的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.906) - AI开发平台ModelArts

history) if image: image.save('1.jpg') else: print("no box") 运行推理脚本。 python infer.py 推理结果如下所示。图1 推理结果（1）图2 推理结果（2） Step5 调用API接口推理进入源码根目录，安装依赖。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
准备镜像环境 - AI开发平台ModelArts

载地址：https://huggingface.co/madebyollin/sdxl-vae-fp16-fix/tree/main 下载开源数据集pokemon-dataset并上传到宿主机上，官网下载地址：https://huggingface.co/datasets/say

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
模型配置文件编写说明 - AI开发平台ModelArts

on为必填参数。Image镜像制作规范可参见创建模型的自定义镜像规范。 runtime 否 String 模型运行时环境，系统默认使用python2.7。runtime可选值与model_type相关，当model_type设置为Image时，不需要设置runtime，当mode

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
准备镜像环境 - AI开发平台ModelArts

载地址：https://huggingface.co/madebyollin/sdxl-vae-fp16-fix/tree/main 下载开源数据集pokemon-dataset并上传到宿主机上，官网下载地址：https://huggingface.co/datasets/say

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.907）
自定义引擎创建模型规范 - AI开发平台ModelArts

#!/bin/bash # 自定义脚本内容 ... # run.sh调用app.py启动服务器，app.py请参考https示例 python app.py 除了按上述要求设置启动命令，您也可以在镜像中自定义启动命令，在创建模型时填写与您镜像中相同的启动命令。提供的服务可使

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

/home/ma-user/ComfyUI && source /usr/local/Ascend/ascend-toolkit/set_env.sh && python main.py --port 30027 --listen 0.0.0.0 --force-fp16 基于dockerfile进行build

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理

总条数： 953

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

安全边界 - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

NPU日志收集上传 - AI开发平台ModelArts

日志提示"Permission denied" - AI开发平台ModelArts

使用Notebook进行代码调试 - AI开发平台ModelArts

查询AI应用详情 - AI开发平台ModelArts

SDXL WebUI基于DevServer适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

旧版训练迁移至新版训练需要注意哪些问题？ - AI开发平台ModelArts

训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

查询训练作业版本详情 - AI开发平台ModelArts

查询训练作业版本列表 - AI开发平台ModelArts

模型的自定义镜像制作流程 - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.906) - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

模型配置文件编写说明 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

自定义引擎创建模型规范 - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线