搜索_华为云

开发环境的应用示例 - AI开发平台ModelArts

", "dev_services": [ "AI_FLOW", "SSH" ], "id": "e1a07296-22a8-4f05-8bc8-e936c8e54103", "name": "modelbox1.3.0-libtorch1.9.1

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？场景描述本文指导如何进行节点内NVLINK带宽性能测试，适用的环境为：Ant8或者Ant1 GPU裸金属服务器，且服务器中已经安装相关GPU驱动软件，以及Pytorch2.0。 GPU A系列裸金属服务器，

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
常见错误原因和解决方法 - AI开发平台ModelArts

常见错误原因和解决方法显存溢出错误网卡名称错误工作负载Pod异常父主题：主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911）
配置Lite Cluster存储 - AI开发平台ModelArts

配置Lite Cluster存储如果没有挂载任何外部存储，此时可用存储空间根据dockerBaseSize的配置来决定，可访问的存储空间比较小，因此建议通过挂载外部存储空间解决存储空间受限问题。容器中挂载存储有多种方式，不同的场景下推荐的存储方式不一样，详情如表1所示。容器存储的基础知识了解请参见存储基础知识

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
常见错误原因和解决方法 - AI开发平台ModelArts

常见错误原因和解决方法显存溢出错误网卡名称错误工作负载Pod异常父主题：主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909）
主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）推理场景介绍准备工作部署推理服务推理性能测试推理精度测试推理模型量化 eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
常见错误原因和解决方法 - AI开发平台ModelArts

常见错误原因和解决方法显存溢出错误网卡名称错误工作负载Pod异常父主题：主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910）
常见错误原因和解决方法 - AI开发平台ModelArts

常见错误原因和解决方法显存溢出错误网卡名称错误工作负载Pod异常 mc2融合算子报错父主题：主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912）
主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）推理场景介绍准备工作部署推理服务推理性能测试推理精度测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题附录：工作负载Pod异常问题和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
查询服务详情 - AI开发平台ModelArts

load_balancer_policy String 在线同步服务设置elb后端转发策略详情枚举值：ROUND_ROBIN(加权轮询算法)，LEAST_CONNECTIONS(加权最少连接)，SOURCE_IP(源ip算法) priority Integer 抢占优先级，取值范围

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）推理场景介绍准备工作部署推理服务推理性能测试推理精度测试推理模型量化 Eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
更新服务配置 - AI开发平台ModelArts

load_balancer_policy 否 String 只支持在线同步服务设置后端elb转发策略，枚举值：ROUND_ROBIN(加权轮询算法)，LEAST_CONNECTIONS(加权最少连接)，SOURCE_IP(源ip算法) service_secrets 否 Array

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
重置节点后无法正常使用？ - AI开发平台ModelArts

重置节点后无法正常使用？问题现象当ModelArts Lite的CCE集群在资源池上只有一个节点，且用户设置了volcano为默认调度器时，在ModelArts侧进行重置节点的操作后，节点无法正常使用，节点上的POD会调度失败。原因分析在ModelArts侧进行节点重置后，

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
管理Lite Cluster资源池 - AI开发平台ModelArts

管理Lite Cluster资源池 Lite Cluster资源池续费管理针对包年包月的Lite Cluster资源池，支持续费功能，还可以开通自动续费、修改自动续费。在ModelArts管理控制台的左侧导航栏中选择“AI专属资源池 > 弹性集群Cluster”，进入Lite资源池列表页中操作

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
自定义脚本代码示例 - AI开发平台ModelArts

25 26 27 28 29 30 # 导出模型 # 模型需要采用saved_model接口保存 print('Exporting trained model to', export_path) builder = tf.saved_model.builder.SavedModelBuilder

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） ComfyUI是一款基于节点工作流的Stable Diffusion操作界面。通过将Stable Diffusion的流程巧妙分解成各个节点，成功实现了工作流的精确定制和可靠复现。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
场景描述 - AI开发平台ModelArts
场景描述 - AI开发平台ModelArts

场景描述 ModelArts作为顶层服务，其部分功能依赖于其他服务的访问权限。本章节主要介绍对于IAM子账号使用ModelArts时，如何根据需要开通的功能配置子账号相应权限。权限列表子账号的权限，由主用户来控制，主用户通过IAM的权限配置功能设置用户组的权限，从而控制用户组内的子账号的权限

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
LoRA微调训练 - AI开发平台ModelArts

LoRA微调训练步骤一上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件到工作环境和上传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911）
与其他云服务的关系 - AI开发平台ModelArts

与其他云服务的关系图1 ModelArts与其他服务的关系示意图与统一身份认证服务的关系 ModelArts使用统一身份认证服务（Identity and Access Management，简称IAM）实现认证功能。IAM的更多信息请参见《统一身份认证服务产品文档》。与对象存储服务的关系

 帮助中心 > AI开发平台ModelArts > 产品介绍
ModelArts与其他服务的关系 - AI开发平台ModelArts

ModelArts与其他服务的关系图1 ModelArts与其他服务的关系示意图与统一身份认证服务的关系 ModelArts使用统一身份认证服务（Identity and Access Management，简称IAM）实现认证功能。IAM的更多信息请参见《统一身份认证服务用户指南

 帮助中心 > AI开发平台ModelArts > 常见问题 > 历史文档待下线

总条数： 106

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开发环境的应用示例 - AI开发平台ModelArts

GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

常见错误原因和解决方法 - AI开发平台ModelArts

配置Lite Cluster存储 - AI开发平台ModelArts

常见错误原因和解决方法 - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

常见错误原因和解决方法 - AI开发平台ModelArts

常见错误原因和解决方法 - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

重置节点后无法正常使用？ - AI开发平台ModelArts

管理Lite Cluster资源池 - AI开发平台ModelArts

自定义脚本代码示例 - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

场景描述 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

与其他云服务的关系 - AI开发平台ModelArts

ModelArts与其他服务的关系 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线