搜索_华为云

创建资源池失败 - AI开发平台ModelArts

创建资源池失败资源配额限制在使用专属资源池时（如资源扩缩容、创建VPC、创建VPC-子网、打通VPC），如果提示相关资源配额受限，请提交工单处理。创建失败/变更失败登录ModelArts管理控制台，在左侧导航栏中选择“AI专属资源池 > 弹性集群 Cluster”，进入“弹性集群

 帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务场景描述本案例介绍如何在Snt9B上进行分布式训练任务，其中Cluster资源池已经默认安装volcano调度器，训练任务默认使用volcano job形式下发lite池集群。训练测试用例使用NLP的bert模型，详细代码和指导可参考Bert。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
SDXL基于DevServer适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

Finetune是指在已经训练好的SDXL模型基础上，使用新的数据集进行微调（fine-tuning）以优化模型性能的过程。本文档主要介绍如何利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，完成SDXL Finetune训练。资源规格要求推荐使用“西

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

Vicuna，用于通用的视觉和语言理解，实现了令人印象深刻的聊天能力，在科学问答（Science QA）上达到了新的高度。本文档主要介绍如何利用ModelArts Lite DevServer，使用PyTorch_npu+华为自研Ascend Snt9B硬件，完成LLaVA模型推理。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
使用llm-compressor工具量化 - AI开发平台ModelArts

使用llm-compressor工具量化当前版本使用llm-compressor工具量化仅支持Deepseek-v2系列模型的W8A8量化。本章节介绍如何在GPU的机器上使用开源量化工具llm-compressor量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
发布免费模型 - AI开发平台ModelArts

阅读并同意《华为云AI Gallery数字内容发布协议》和《华为云AI Gallery服务协议》。单击“发布”。发布使用容器镜像导入的资产时，后台会进行资产安全扫描，如果扫描发现资产有问题，则资产发布失败并邮件通知发布者。编辑资产详情资产发布成功后，发布者可以进入详情页修改该资产的标题、封面图、描述等，让资产更吸引人。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
FLUX.1基于DevServer适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

FLUX.1基于DevServer适配PyTorch NPU推理指导（6.3.909） Flux是一种基于扩散过程的图像生成模型，应用于文生图场景，能够帮助用户生成图像。官方提供了三个版本：FLUX.1-pro、FLUX.1-dev和FLUX.1-schnell。方案概览本方案介绍了在ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
创建DevServer - AI开发平台ModelArts

创建服务器是否启用IPV6。 roce_id 否 String 服务器RoCE网络ID。 security_group_id 是 String 服务器所在的安全组ID。 subnet_id 是 String 服务器所在子网ID。 vpc_id 是 String 服务器所在虚拟私有云ID。表5 EvsVolume

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
IEF节点边缘服务部署失败 - AI开发平台ModelArts

明。处理方法1 在ModelArts管理控制台，选择“权限管理”。在用户名对应的“授权内容”列，单击“查看权限”，确认用户的委托权限是否已包含Tenant Administrator。图1 查看委托权限详情是，重新“启动”边缘服务，若还是“异常”则联系技术支持处理。否，执行下一步，给用户添加委托权限。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
CodeLab - AI开发平台ModelArts
CodeLab - AI开发平台ModelArts

CodeLab 如何将git clone的py文件变为ipynb文件 Notebook里面运行的实例，如果重启，数据集会丢失么？ Jupyter可以安装插件吗？是否支持在CodeLab中使用昇腾的卡进行训练？如何在CodeLab上安装依赖？父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务本章节介绍如何在ModelArts的推理生产环境（ModelArts控制台的在线服务功能）中部署推理服务。 Step1 准备模型文件和权重文件在OBS桶中，创建文件夹，准备模型权重文件、推理启动脚本run_vllm.sh及SSL证书。此处以chatglm3-6b为例。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务本章节介绍如何在ModelArts的推理生产环境（ModelArts控制台的在线服务功能）中部署推理服务。 Step1 准备模型文件和权重文件在OBS桶中，创建文件夹，准备模型权重文件、推理启动脚本run_vllm.sh及SSL证书。此处以chatglm3-6b为例。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
推理性能测试 - AI开发平台ModelArts

推理性能测试本章节介绍如何进行推理性能测试，建议在Notebook的JupyterLab中另起一个Terminal，执行benchmark脚本进行性能测试。若需要在生产环境中进行推理性能测试，请通过调用接口的方式进行测试。约束限制创建在线服务时，每秒服务流量限制默认为100

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
推理性能测试 - AI开发平台ModelArts

推理性能测试本章节介绍如何进行推理性能测试，建议在Notebook的JupyterLab中另起一个Terminal，执行benchmark脚本进行性能测试。如果需要在生产环境中进行推理性能测试，请通过调用接口的方式进行测试。约束限制创建在线服务时，每秒服务流量限制默认为10

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
配置仪表盘查看指标数据 - AI开发平台ModelArts

delArts也提供了针对集群的配置模板。本章节通过使用ModelArts提供的模板查看指标和创建Dashboards查看指标的方式，说明如何进行仪表盘配置。Grafana的更多使用请参考Grafana官方文档。准备工作 ModelArts提供了集群视图、节点视图、用户视图、任

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标
多模态模型推理性能测试 - AI开发平台ModelArts

# 执行静态、动态性能评测脚本 ├── requirements.txt # 第三方依赖静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在步骤四制作推理镜像步骤中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
部署推理服务 - AI开发平台ModelArts

部署推理服务本章节介绍如何使用vLLM 0.6.0框架部署并启动推理服务。前提条件已准备好Lite k8s Cluster环境，具体参考准备环境。推荐使用“西南-贵阳一”Region上的Cluster和昇腾Snt9b资源。安装过程需要连接互联网git clone，确保集群可以访问公网。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
多模态模型推理性能测试 - AI开发平台ModelArts

# 执行静态、动态性能评测脚本 ├── requirements.txt # 第三方依赖静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在步骤四制作推理镜像步骤中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试
日志提示“pandas.errors.ParserError: Error tokenizing data. C error: Expected .* fields” - AI开发平台ModelArts

tokenizing data. C error: Expected 4 field 原因分析 csv中文件的每一行的列数不相等。处理方法可以使用以下方法处理：校验csv文件，将多出字段的行删除。在代码中忽略错误行，参考如下： import pandas as pd pd.read_csv(filePath

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
注册自定义镜像 - AI开发平台ModelArts

请求参数表2 请求Body参数参数是否必选参数类型描述 arch 否 String 该镜像所支持处理器架构类型，默认值X86_64。枚举值： X86_64：x86处理器架构。 AARCH64：ARM体系架构。 description 否 String 该镜像所对应的描述信息，长度限制512个字符。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理

总条数： 1392

上一页
1
...
46
47
48
...
70
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建资源池失败 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

SDXL基于DevServer适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

使用llm-compressor工具量化 - AI开发平台ModelArts

发布免费模型 - AI开发平台ModelArts

FLUX.1基于DevServer适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

创建DevServer - AI开发平台ModelArts

IEF节点边缘服务部署失败 - AI开发平台ModelArts

CodeLab - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

配置仪表盘查看指标数据 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

日志提示“pandas.errors.ParserError: Error tokenizing data. C error: Expected .* fields” - AI开发平台ModelArts

注册自定义镜像 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线