搜索_华为云

服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

en。 APIG.1009 AppKey和AppSecret不匹配当服务预测使用的AppKey和AppSecret不匹配时，报错“APIG.1009”：“AppKey or AppSecret is invalid”。查询AppKey和AppSecret，使用APP认证访问在

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
训练场景和方案介绍 - AI开发平台ModelArts

训练场景和方案介绍 Stable Diffusion（简称SD）是一种基于扩散过程的图像生成模型，应用于文生图场景，能够帮助用户生成图像。方案概览本方案介绍了在ModelArts Lite DevServer上使用昇腾计算资源Ascend Snt9B开展SDXL和SD1.5模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.907）
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

SFS类型和容量选择 ModelArts网络关联SFS Turbo OBS-SFS Turbo联动方案涉及VPC、SFS Turbo HPC型文件系统、OBS对象存储服务和ModelArts资源池。如果要使用训练作业挂载SFS Turbo功能，则需要配置ModelArts和SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作
查询服务详情 - AI开发平台ModelArts

running：运行中，服务正常运行。 deploying：部署中，服务正在部署，包含打镜像和调度资源部署。 concerning：告警，后端实例部分存在异常。 failed：失败，服务部署失败，失败原因可以看事件和日志标签页。 stopped：停止。 finished：只有批量服务会有这个状态，表示运行完成。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
Lite Cluster资源开通 - AI开发平台ModelArts

28集群版本支持通过控制台、API方式创建，CCE 1.23和CCE 1.25版本支持通过API方式创建。不同版本的CCE集群创建方式请见Kubernetes版本策略。若您已有CCE集群，但CCE集群版本低于1.23，则可参考升级集群的流程和方法，建议将集群升级至1.28版本。 Step6

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
训练场景和方案介绍 - AI开发平台ModelArts

训练场景和方案介绍 Stable Diffusion（简称SD）是一种基于扩散过程的图像生成模型，应用于文生图场景，能够帮助用户生成图像。方案概览本方案介绍了在ModelArts Lite DevServer上使用昇腾计算资源Ascend Snt9B开展SDXL和SD1.5模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

job形式下发lite池集群。训练测试用例使用NLP的bert模型，详细代码和指导可参考Bert。图1 任务示意图操作步骤拉取镜像。本测试镜像为bert_pretrain_mindspore:v1，已经把测试数据和代码打进镜像中。 docker pull swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
Standard资源管理 - AI开发平台ModelArts

操作资源池中的节点和k8s集群。请参见弹性集群k8s Cluster。弹性裸金属：弹性裸金属提供不同型号的xPU裸金属服务器，您可以通过弹性公网IP进行访问，在给定的操作系统镜像上可以自行安装GPU&NPU相关的驱动和其他软件，使用SFS或OBS进行数据存储和读取相关的操作，满

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
在线服务处于运行中状态时，如何填写推理请求的request header和request body - AI开发平台ModelArts

APP认证的方式：APP认证方式又可以细分为AppCode认证和APP签名认证。 AppCode认证需要在header的X-Apig-AppCode字段上填入绑定给该在线服务的APP的AppCode。 APP签名认证需要在header的X-Sdk-Date和Authorization字段中填入通过s

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.908） - AI开发平台ModelArts

推理部署推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B单机单卡。约束与限制支持Diffusers 0.29.2及以前版本。 Cann版本支持cann_8.0.rc3。 PyTorch版本支持2.1。获取软件和镜像表1 获取软件和镜像分类名称获取路径插件代码包

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
Lite Server高危操作一览表 - AI开发平台ModelArts

如果升级/修改操作系统内核或者驱动，很可能导致驱动和内核版本不兼容，从而导致OS无法启动，或者基本功能不可用。相关高危命令如：apt-get upgrade。高如果需要升级/修改，请联系华为云技术支持。切换或者重置操作系统。服务器在进行过“切换或者重置操作系统”操作后，EVS系统盘ID发生变化，和下单时订单中的EVS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导(6.3.906) - AI开发平台ModelArts

推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B。表1 环境要求名称版本 PyTorch pytorch_2.1.0 驱动 23.0.5 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

无法执行相关GPU命令，只能尝试释放D+进程。处理方法 “nvidia-smi”是一个NVIDIA GPU监视器命令行工具，用于查看GPU的使用情况和性能指标，可以帮助用户进行GPU优化和故障排除。但是建议在业务软件或训练算法中，避免频繁使用“nvidia-smi”命令功能获取相关信息，存在锁死的风险。出现D+进程后可以尝试如下方法：

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

peed; sh ./scripts/obs_pipeline.sh Step2 配置数据输入和输出单击“增加训练输入”和“增加训练输出”，用于配置训练作业开始时需要输入数据的路径和训练结束后输出数据的路径。在“输入”的输入框内设置变量：ORIGINAL_TRAIN_DATA

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）
使用MaaS部署模型服务 - AI开发平台ModelArts

等设置信息。 “监控”：可以查看服务监控和资源监控信息。 “算力利用率”表示每分钟NPU的平均使用率，当请求率较低时，使用率会显示为0。 “事件”：可以查看服务的事件信息。事件保存周期为1个月，1个月后自动清理数据。 “日志”：可以搜索和查看服务日志。删除部署任务删除操作无法恢复，请谨慎操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
查询AI应用详情 - AI开发平台ModelArts

户拥有的AI应用，其中model_id字段即为模型ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。通

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

场景说明本文详细介绍如何将本地已经制作好的模型包导入ModelArts的开发环境Notebook中进行调试和保存，然后将保存后的镜像部署到推理。本案例仅适用于华为云北京四和上海一站点。操作流程如下： Step1 在Notebook中复制模型包 Step2 在Notebook中调试模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
LoRA微调训练 - AI开发平台ModelArts

peed; sh ./scripts/obs_pipeline.sh Step2 配置数据输入和输出单击“增加训练输入”和“增加训练输出”，用于配置训练作业开始时需要输入数据的路径和训练结束后输出数据的路径。在“输入”的输入框内设置变量：ORIGINAL_TRAIN_DATA

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）
SFT全参微调训练 - AI开发平台ModelArts

peed; sh ./scripts/obs_pipeline.sh Step2 配置数据输入和输出单击“增加训练输入”和“增加训练输出”，用于配置训练作业开始时需要输入数据的路径和训练结束后输出数据的路径。在“输入”的输入框内设置变量：ORIGINAL_TRAIN_DATA

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）
ModelArts计费模式概述 - AI开发平台ModelArts

ModelArts计费模式概述 ModelArts服务提供包年/包月和按需计费两种计费模式，以满足不同场景下的用户需求。如您需要快速了解ModelArts服务不同计费模式的具体价格，请参见ModelArts价格详情。包年/包月：一种预付费模式，即先付费再使用，按照订单的购买周期

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式

总条数： 706

上一页
1
...
20
21
22
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

训练场景和方案介绍 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

训练场景和方案介绍 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

Standard资源管理 - AI开发平台ModelArts

在线服务处于运行中状态时，如何填写推理请求的request header和request body - AI开发平台ModelArts

SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.908） - AI开发平台ModelArts

Lite Server高危操作一览表 - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的Finetune训练指导(6.3.906) - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

使用MaaS部署模型服务 - AI开发平台ModelArts

查询AI应用详情 - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

ModelArts计费模式概述 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线