搜索_华为云

在ModelArts中部署模型时，为什么无法选择Ascend Snt3资源？ - AI开发平台ModelArts

ARM: 3 核 6GB”资源为灰色，无法选择。解决方案：方法1：如果您希望使用公共资源池下的Ascend Snt3，可以等待其他用户释放，即其他使用Ascend Snt3芯片的服务停止，您即可选择此资源进行部署上线。方法2：如果专属资源池还有Ascend Snt3资源，您可以创建一个Ascend

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
Yaml配置文件参数配置说明 - AI开发平台ModelArts

Face权重时，对应的存放绝对或相对路径。请根据实际规划修改。 do_train true 指示脚本执行训练步骤，用来控制是否进行模型训练的。如果设置为true，则会进行模型训练；如果设置为false，则不会进行模型训练。 cutoff_len 4096 文本处理时的最大长度，此处为4096，用户可根据自己要求适配。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
查询服务列表 - AI开发平台ModelArts

/v1/{project_id}/services 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 service_id 否 String 服务ID，在创建

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

4503 问题现象在线服务部署完成且服务已经处于“运行中”的状态后，向运行的服务发起推理请求，报错ModelArts.4503。原因分析及处理方法服务预测报错ModelArts.4503有多种场景，常见场景如下：通信出错请求报错：{"error_code":"ModelArts

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
将模型部署为批量推理服务 - AI开发平台ModelArts

例如，模型来源于自动学习项目，则计算资源将自动关联自动学习规格供使用。 “实例数” 设置当前版本模型的实例个数。如果节点个数设置为1，表示后台的计算模式是单机模式；如果节点个数设置大于1，表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。 “环境变量” 设置环境变量，注入环境变量到容器实例。为确保您的数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

PTA_TORCHAIR_DECODE_GEAR_LIST=2,4,6,8,16,32 # 设置动态分档的挡位，根据实际情况设置，另外请不要设置挡位1 export VLLM_ENGINE_ITERATION_TIMEOUT_S=900 # 设置vllm请求超时时间图模式主要针对小模型的场景，可减少算子下发的瓶颈，目前仅针对Qwen2-1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
配置Lite Server存储 - AI开发平台ModelArts

具体步骤请参考挂载NFS协议类型文件系统到云服务器（Linux）。为避免已挂载文件系统的云服务器重启后，挂载信息丢失，您可以在云服务器设置重启时进行自动挂载，具体步骤请参考服务器重启后自动挂载指南。使用对象存储服务OBS作为存储若使用OBS服务作为存储方案，推荐使用“并行

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
Yaml配置文件参数配置说明 - AI开发平台ModelArts

or false】，默认false do_train true 指示脚本执行训练步骤，用来控制是否进行模型训练的。如果设置为true，则会进行模型训练；如果设置为false，则不会进行模型训练。 cutoff_len 4096 文本处理时的最大长度，此处为4096，用户可根据自己要求适配。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练脚本说明
从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

nda3 /home/ma-user/miniconda3 # 设置容器镜像默认用户与工作目录 USER ma-user WORKDIR /home/ma-user # 设置容器镜像预置环境变量 # 请务必设置 PYTHONUNBUFFERED=1, 以免日志丢失 ENV P

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

0.5.3 打印如下信息，表示构建镜像成功。图3 成功构建镜像注：若构建镜像时报错pip超时，可在Dockerfile中添加如下命令设置pip源 RUN pip config set global.index-url https://xxx/simple RUN pip config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
资源池监控 - AI开发平台ModelArts

取值范围大于0并且大于等于(endTimeInMillis - startTimeInMillis) / (60 * 1000) - 1 当开始时间与结束时间都设置为-1时，系统会将结束时间设置为当前时间UTC毫秒值，并按(endTimeInMillis - durationInMinutes * 60 * 1000)计算开始时间。如：-1

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

称。打印如下信息，表示构建镜像成功。图4 成功构建镜像如果推理需要使用NPU加速图片预处理，适配了llava-1.5模型，启动时需要设置export ENABLE_USE_DVPP=1，需要安装torchvision_npu，可放到镜像制作脚本./AscendCloud/A

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 准备工作
自定义脚本代码示例 - AI开发平台ModelArts

父类，各模型类型的父类名称和导入语句如请参考表1。本案例中调用父类“_inference(self, data)”推理请求方法，因此下文代码中不需要重写方法。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
停止可视化作业 - AI开发平台ModelArts

top 参数说明如表1所示。表1 参数说明参数是否为必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 job_id 是 String 可视化作业的ID。请求消息无请求参数。响应消息响应参数如表2所示。表2

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
TensorFlow在OBS写入TensorBoard到达5GB时停止 - AI开发平台ModelArts

文件。当超过5GB后，由于达到了OBS单次导入文件大小的上限，导致无法继续写入。处理方法如果在运行训练作业的过程中出现该问题，建议处理方法如下：推荐使用本地缓存的方式来解决，使用如下方法： import moxing.tensorflow as mox mox.cache()

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
ECS获取基础镜像 - AI开发平台ModelArts

ECS获取基础镜像 Step1 登录ECS服务器根据创建ECS服务器创建完成ECS服务器后，单击“远程登录”，可使用华为CloudShell远程登录。后续安装Docker、获取镜像、构建镜像等操作均在该ECS上进行。 Step2 创建镜像组织在SWR服务页面创建镜像组织。图1

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
Yaml配置文件参数配置说明 - AI开发平台ModelArts

Face权重时，对应的存放绝对或相对路径。请根据实际规划修改。 do_train true 指示脚本执行训练步骤，用来控制是否进行模型训练的。如果设置为true，则会进行模型训练；如果设置为false，则不会进行模型训练。 cutoff_len 4096 文本处理时的最大长度，此处为4096，用户可根据自己要求适配。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
更新Notebook实例 - AI开发平台ModelArts

String Notebook实例ID，可通过调用查询Notebook实例列表接口获取。 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 description 否 String 支

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
自定义镜像模型部署为在线服务时出现异常 - AI开发平台ModelArts

pull image, retry later”，同时在“日志”页签中，无任何信息。图1 部署在线服务异常解决方法出现此问题现象，通常是因为您部署的模型过大导致的。解决方法如下：精简模型，重新导入模型和部署上线。购买专属资源池，在部署上线为在线服务时，使用专属资源池进行部署。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
查询可视化作业列表 - AI开发平台ModelArts

jobs 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 查询检索参数参数是否必选参数类型说明 status 否 String 作业状态的查询，默认为所有

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业

总条数： 1510

上一页
1
...
27
28
29
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在ModelArts中部署模型时，为什么无法选择Ascend Snt3资源？ - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

将模型部署为批量推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（Tensorflow+GPU） - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

资源池监控 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

自定义脚本代码示例 - AI开发平台ModelArts

停止可视化作业 - AI开发平台ModelArts

TensorFlow在OBS写入TensorBoard到达5GB时停止 - AI开发平台ModelArts

ECS获取基础镜像 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

更新Notebook实例 - AI开发平台ModelArts

自定义镜像模型部署为在线服务时出现异常 - AI开发平台ModelArts

查询可视化作业列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线