搜索_华为云

删除API - AI开发平台ModelArts
删除API - AI开发平台ModelArts

响应示例无状态码状态码描述 204 No Content 401 Unauthorized 403 Forbidden 500 Server Internal Error 错误码请参见错误码。父主题： APP认证管理

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

Lite的Cluster环境中部署ComfyUI，使用NPU卡进行推理。方案概览本方案介绍了在ModelArts的Lite Cluster上使用昇腾计算资源部署ComfyUI用于推理的详细过程。完成本方案的部署，需要先联系您所在企业的华为方技术支持购买Cluster资源。本方案目前仅适用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
ModelArts Standard使用流程 - AI开发平台ModelArts

k使用场景。 Standard的模型训练功能提供了界面化的训练调试环境和生产环境，用户可以使用自己的数据和算法，利用Standard提供的计算资源开展模型训练。具体请参见使用ModelArts Standard训练模型。 Standard的推理部署功能提供了界面化的推理部署生产环

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
管理AI Gallery模型 - AI开发平台ModelArts

义模型规范，才支持使用AI Gallery工具链服务。硬件资源选择支持运行该模型的硬件类型。最低可运行规格设置能够运行该模型的最低计算规格。在AI Gallery工具链服务中使用该模型时，只能选取等同或高于该规格的算力资源进行任务下发。是否支持分布式训练/推理选择该模

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
文档导读 - AI开发平台ModelArts
文档导读 - AI开发平台ModelArts

内容 SDK简介简要介绍ModelArts SDK的概念。快速开始介绍如何使用ModelArts SDK进行二次开发。（可选）本地服务器安装ModelArts SDK 介绍如何在本地安装ModelArts SDK。（可选）Session鉴权 Session模块的主要作用是

 帮助中心 > AI开发平台ModelArts > SDK参考
快速开始 - AI开发平台ModelArts
快速开始 - AI开发平台ModelArts

ModelArts SDK支持在本地安装配置使用。使用时，需进行Session鉴权。本地安装SDK。如果本地未安装SDK，可参考（可选）本地服务器安装ModelArts SDK安装；如果本地已安装，则无需再次安装。进行Session鉴权。可参见（可选）Session鉴权完成鉴权。鉴权完成后，即可开始使用。

帮助中心 > AI开发平台ModelArts > SDK参考
查询训练作业列表 - AI开发平台ModelArts

表59 SSHResp 参数参数类型描述 key_pair_names Array of strings SSH密钥对名称，可以在云服务器控制台（ECS）“密钥对”页面创建和查看。 task_urls Array of TaskUrls objects SSH连接地址信息。表60

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
创建训练作业版本 - AI开发平台ModelArts

config 是 Object 创建训练作业需要的参数。详情参见表3。表3 config属性列表参数是否必选参数类型说明 worker_server_num 是 Integer 训练作业worker的个数。最大值请从查询作业资源规格接口获取。 app_url 是 String 训练

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
推理业务迁移评估表 - AI开发平台ModelArts

hon 3.7等。 - CPU使用率业务中是否有大量使用CPU的代码，以及日常运行过程中CPU的占用率（占用多少个核心），以及使用CPU计算的业务功能说明和并发机制。 - 是否有Linux内核驱动是否有业务相关的Linux内核驱动代码。 - 依赖第三方组件列表当前业务依赖的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
使用GPTQ量化 - AI开发平台ModelArts

"gptq"参数，其他参数请参考Step3 创建服务启动脚本 python -m vllm.entrypoints.openai.api_server --model <your_model> --quantization "gptq" 3. 如果是sdk使用的方式，指定quantization="gptq"参数

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

"gptq"参数，其他参数请参考Step3 启动推理服务 python -m vllm.entrypoints.openai.api_server --model <your_model> --quantization "gptq" 3. 如果是sdk使用的方式，指定quantization="gptq"参数

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

"gptq"参数，其他参数请参考Step3 启动推理服务 python -m vllm.entrypoints.openai.api_server --model <your_model> --quantization "gptq" 3. 如果是sdk使用的方式，指定quantization="gptq"参数

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

"gptq"参数，其他参数请参考Step3 启动推理服务 python -m vllm.entrypoints.openai.api_server --model <your_model> --quantization "gptq" 3. 如果是sdk使用的方式，指定quantization="gptq"参数

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
迁移环境准备 - AI开发平台ModelArts

缺点：资源申请周期长，购买成本高，管理视角下资源使用效率较低。环境开通指导请参考DevServer资源开通；环境配置指导请参考Snt9B裸金属服务器环境配置指南。本文基于方式二的环境进行操作，请参考方式二中的环境开通和配置指导完成裸机和容器开发初始化配置。注意业务基础镜像选择Ascend+PyTorch镜像。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
运行第一条Workflow - AI开发平台ModelArts

继续运行当工作流运行至服务部署节点，状态为“等待输入”，在“输入”区域选择推理需要使用到的资源规格，完成后选择“继续运行”，等待服务部署完成。计算节点规格：华北-北京四可支持限时免费的规格，但每个用户仅允许创建一个基于此免费规格的实例。按需计费规格，使用完之后请及时停止Workflow，避免产生不必要的费用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
训练启动脚本说明和参数配置 - AI开发平台ModelArts

Notebook数据上传至OBS mox.file.copy_parallel(local_data_dir, obs_data_dir) 不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 不同模型推荐的参数与NPU卡数设置序号

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
Lite Server高危操作一览表 - AI开发平台ModelArts

本功能不可用。相关高危命令如：apt-get upgrade。高如果需要升级/修改，请联系华为云技术支持。切换或者重置操作系统。服务器在进行过“切换或者重置操作系统”操作后，EVS系统盘ID发生变化，和下单时订单中的EVS ID已经不一致，因此EVS系统盘将不支持扩容，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
管理Lite Cluster节点 - AI开发平台ModelArts

留。 - 重部署：通过更换为新服务器实现修复，修复耗时较短，本地盘数据会丢失。修复期间实例将无法工作，请确保相关实例业务已离线。如果云服务器上的业务不可停止，请勿修复，并联系技术支持进行处理。若选择了重部署修复方式，实例会立即关机并迁移到新服务器，本地盘数据会被清空，请提前做好业务迁移和数据备份。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

hon 3.7等。 - CPU使用率业务中是否有大量使用CPU的代码，以及日常运行过程中CPU的占用率（占用多少个核心），以及使用CPU计算的业务功能说明和并发机制。 - 是否有Linux内核驱动是否有业务相关的Linux内核驱动代码。 - 依赖第三方组件列表当前业务依赖的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

/目录下通过vLLM服务API接口启动服务，具体操作命令如下，API Server的命令相关参数说明如下，可以根据参数说明修改配置。 python -m vllm.entrypoints.api_server --model ${container_model_path} \ --max-num-seqs=256

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）

总条数： 938

上一页
1
...
41
42
43
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

删除API - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

ModelArts Standard使用流程 - AI开发平台ModelArts

管理AI Gallery模型 - AI开发平台ModelArts

文档导读 - AI开发平台ModelArts

快速开始 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

创建训练作业版本 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

迁移环境准备 - AI开发平台ModelArts

运行第一条Workflow - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

Lite Server高危操作一览表 - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线