搜索_华为云

在ModelArts Standard运行GPU训练作业的准备工作 - AI开发平台ModelArts

包年包月套餐，提前规划资源的使用额度和时长。在欠费时，您需要及时（15天之内）续费以避免您的文件系统资源被清空。购买的SFS可以用于存储数据和代码。如何购买弹性文件服务？容器镜像服务SWR 容器镜像服务分为企业版和共享版。共享版计费项包括存储空间和流量费用，目前均免费提供给您。企业版支持按需计费模式。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
使用DCGM监控Lite Server资源 - AI开发平台ModelArts

口：在浏览器地址栏输入xx.xx.xx.xx:3000，登录Grafana，默认账号密码为：admin/admin。在配置管理页面，添加数据源，类型选择Prometheus。备注：xx.xx.xx.xx为Grafana的所在宿主机的IP地址图1 Prometheus 在HT

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
昇腾迁移融合算子API替换样例 - AI开发平台ModelArts

cuda() result = fast_gelu_module(input_data) torch_npu.npu_rms_norm 输入数据dtype仅支持float16、bfloat16、float。 torch原生代码示例如下： import torch class TorchRMSNorm(torch

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > MA-Advisor自动诊断工具使用指导
SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。配置Cluster资源，确保可以通过公网访问Cluster机器，具体配置请参见配置Lite Cluster网络。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

/home:/home_host是指将宿主机home目录挂载到容器home_host目录，建议在容器中使用该挂载目录进行代码和数据的存储，以便持久化保存数据 docker run -itd --cap-add=SYS_PTRACE -e ASCEND_VISIBLE_DEVICES=0

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

s://github.com/vllm-project/vllm/tree/v0.3.2，版本：v0.3.2）。仅支持FP16和BF16数据类型推理。适配的CANN版本是cann_8.0.rc2，驱动版本是23.0.5。本案例仅支持在专属资源池上运行。支持的模型列表本方

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
获取训练作业事件列表 - AI开发平台ModelArts

String 训练作业ID。获取方法请参见查询训练作业列表。表2 Query参数参数是否必选参数类型描述 offset 否 Integer 数据条目偏移量。 limit 否 Integer 指定每一页返回的最大条目数，取值范围[1,100]，默认为50。 order 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

测试该在线服务的功能。图1 任务示意图操作步骤拉取镜像。本测试镜像为bert_pretrain_mindspore:v1，已经把测试数据和代码打进镜像中。 docker pull swr.cn-southwest-2.myhuaweicloud.com/os-public-

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
部署推理服务 - AI开发平台ModelArts

使用多少token，必须大于或等于--max-model-len，推荐使用4096或8192。 --dtype：模型推理的数据类型。支持FP16和BF16数据类型推理。float16表示FP16，bfloat16表示BF16。 --tensor-parallel-size：模型并

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
创建Notebook实例 - AI开发平台ModelArts

实例的机器规格。如下规格仅供参照，实际支持规格以具体区域为准。 modelarts.vm.cpu.2u：Intel CPU通用规格，用于快速数据探索和实验。 modelarts.vm.cpu.8u：Intel CPU算力增强型，适用于密集计算场景下运算。 image_id 是 String

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
使用AWQ量化 - AI开发平台ModelArts

A16支持128和-1，W8A16支持-1。 --w-bit：量化比特数，W4A16设置4，W8A16设置8。 --calib-data：数据集路径，推荐使用：https://huggingface.co/datasets/mit-han-lab/pile-val-backup，注意需指定到val

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

168.20.1 slots=1 192.168.20.2 slots=1 NCCL环境变量说明： NCCL_IB_GID_INDEX=3 ：数据包走交换机的队列4通道，这是RoCE协议标准。 NCCL_IB_TC=128 ：使用RoCE v2协议，默认使用RoCE v1，但是v1在

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
FlUX.1基于DevServer适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。 SSH登录机器后，检查NPU卡状态。运行如下命令，返回NPU设备信息。 npu-smi info

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

output2=obs://bucket/output2 --input String 否训练的输入信息，指定后，训练作业将会把对应OBS上的数据下载到训练容器，并将数据存储路径通过指定的参数传递给训练脚本。如果需要指定多个参数，可以使用--input data_path1=obs://bucket/data1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
自动模型优化介绍 - AI开发平台ModelArts

自动模型优化介绍 ModelArts训练支持超参搜索功能，自动实现模型超参搜索，为您的模型匹配最合适的超参。在模型训练过程中，有很多超参需要根据任务进行调整，比如learning_rate、weight_decay等，这一工作往往需要一个有经验的算法工程师花费一定精力和大量时间

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 自动模型优化（AutoSearch）
使用AWQ量化 - AI开发平台ModelArts

A16支持128和-1，W8A16支持-1。 --w-bit：量化比特数，W4A16设置4，W8A16设置8。 --calib-data：数据集路径，推荐使用：https://huggingface.co/datasets/mit-han-lab/pile-val-backup，注意需指定到val

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

A16支持128和-1，W8A16支持-1。 --w-bit：量化比特数，W4A16设置4，W8A16设置8。 --calib-data：数据集路径，推荐使用：https://huggingface.co/datasets/mit-han-lab/pile-val-backup，注意需指定到val

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

使用PyCharm ToolKit创建并调试训练作业 OBS上传下载上传本地文件或文件夹至OBS，从OBS下载文件或文件夹到本地。使用PyCharm上传数据至Notebook 前提条件本地已安装2019.2-2023.2之间（包含2019.2和2023.2）版本的PyCharm专业版。SSH

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
服务部署 - AI开发平台ModelArts
服务部署 - AI开发平台ModelArts

服务部署自定义镜像模型部署为在线服务时出现异常部署的在线服务状态为告警服务启动失败服务部署、启动、升级和修改时，拉取镜像失败如何处理？服务部署、启动、升级和修改时，镜像不断重启如何处理？服务部署、启动、升级和修改时，容器健康检查失败如何处理？服务部署、启动、升级和修改时，资源不足如何处理？

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。检查环境。 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info 如

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理

总条数： 1627

上一页
1
...
71
72
73
...
82
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在ModelArts Standard运行GPU训练作业的准备工作 - AI开发平台ModelArts

使用DCGM监控Lite Server资源 - AI开发平台ModelArts

昇腾迁移融合算子API替换样例 - AI开发平台ModelArts

SDXL&SD1.5 WebUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

获取训练作业事件列表 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

FlUX.1基于DevServer适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

自动模型优化介绍 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

服务部署 - AI开发平台ModelArts

SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线