搜索_华为云

在ModelArts控制台查看监控指标 - AI开发平台ModelArts

训练作业：用户在运行训练作业时，可以查看多个计算节点的CPU、GPU、NPU资源使用情况。具体请参见训练资源监控章节。在线服务：用户将模型部署为在线服务后，可以通过监控功能查看CPU、内存、GPU等资源使用统计信息和AI应用调用次数统计，具体参见查看服务详情章节。父主题： ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
日志提示“pandas.errors.ParserError: Error tokenizing data. C error: Expected .* fields” - AI开发平台ModelArts

在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
AI开发基本流程介绍 - AI开发平台ModelArts

大化地开发数据价值，发挥数据作用。 AI开发的基本流程 AI开发的基本流程通常可以归纳为几个步骤：确定目的、准备数据、训练模型、评估模型、部署模型。图1 AI开发流程确定目的在开始AI开发之前，必须明确要分析什么？要解决什么问题？商业目的是什么？基于商业的理解，整理AI开发

 帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
发布本地AI应用到AI Gallery - AI开发平台ModelArts

Gallery，单击右上角“我的Gallery”进入我的Gallery页面。单击左上方“创建资产”，选择“AI应用”。在“创建AI应用”页面配置参数。表1 创建AI应用参数是否必填说明 AI应用英文名称是自定义一个易于分辨的AI应用英文名称。只能以数字、大小字母、下划线组成，且字符长度在3到90之间。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
（可选）Session鉴权 - AI开发平台ModelArts

管理、服务管理的鉴权。用户AK-SK认证模式：支持OBS管理、数据管理、训练管理、模型管理、服务管理的鉴权。用户名密码认证模式本地安装完成ModelArts SDK后，可通过用户名密码认证模式进行Session鉴权。示例代码如下：使用账号认证 “username”填写您的账号名。

帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权
创建Standard专属资源池 - AI开发平台ModelArts

进行选择。虚拟私有云VPC是一套为实例构建的逻辑隔离的、由用户自主配置和管理的虚拟网络环境。为云服务器、云容器、云数据库等资源构建隔离的、用户自主配置和管理的虚拟网络环境，提升用户资源的安全性，简化用户的网络部署。登录ModelArts管理控制台，在左侧导航栏中选择“AI专属资源池

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
Finetune训练 - AI开发平台ModelArts

Finetune训练服务使用ma-user用户执行如下命令运行训练脚本。 sh diffusers_sdxl_finetune_train.sh 训练执行脚本中配置了保存checkpoint的频率，每500steps保存一次，如果磁盘空间较小，这个值可以改大到5000，避免磁盘空间写满，导致训练失败终止。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.907）
Pytorch1.0引擎提示“RuntimeError: std::exception” - AI开发平台ModelArts

在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题：云上迁移适配故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
Finetune训练 - AI开发平台ModelArts

Finetune训练服务使用ma-user用户执行如下命令运行训练脚本。 sh diffusers_sdxl_finetune_train.sh 训练执行脚本中配置了保存checkpoint的频率，每500steps保存一次，如果磁盘空间较小，这个值可以改大到5000，避免磁盘空间写满，导致训练失败终止。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
查询开发环境实例列表 - AI开发平台ModelArts

参数类型描述 id String 配置ID。 name String 配置名称。 description String 配置描述。 de_type String 开发环境类型，当前仅支持Notebook。 provision Object 部署信息，如表6所示。 labels Map<String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” - AI开发平台ModelArts

在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
查看Notebook实例事件 - AI开发平台ModelArts

write permissions to {conda_path}）重要 ConfigurationError conda命令不可用导致配置modelarts sdk和ma-cli路径到conda env失败（The modelarts sdk and cli is unavailable

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
新建Workflow工作流 - AI开发平台ModelArts

description 否 String Workflow工作流配置参数的描述。 example 否 Object Workflow工作流配置参数的样例。 delay 否 Boolean 是否为延迟输入的参数，默认为否。 default 否 Object 配置参数的默认值。 value 否 Object

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
数据保护技术 - AI开发平台ModelArts

在ModelArts中导入AI应用时，支持用户自己选择HTTP和HTTPS两种传输协议，为保证数据传输的安全性，推荐用户使用更加安全的HTTPS协议。数据完整性检查推理部署功能模块涉及到的用户模型文件和发布到AIGallery的资产在上传过程中，有可能会因为网络劫持、数据缓存等原因，存在数据不一致的问题。Mo

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
日志提示“ Network is unreachable” - AI开发平台ModelArts

在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题：外网访问限制

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 外网访问限制
查询模型对象列表 - AI开发平台ModelArts

order="desc") print(model_object_list) 参数说明查询模型列表，返回list，list大小等于当前用户所有已经部署的模型个数， list中每个元素都是Model对象，对象属性和查询模型详情相同。查询模型列表返回说明： model_list = [model_instance1

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
SFT全参微调训练任务 - AI开发平台ModelArts

训练的数据集预处理说明。 Step2 修改训练超参配置以Llama2-70b和Llama2-13b的SFT微调为例，执行脚本为0_pl_sft_70b.sh 和 0_pl_sft_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示。其他超参均有默认值，可以参考表1按照实际需求修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）
托管数据集到AI Gallery - AI开发平台ModelArts

Gallery，单击右上角“我的Gallery”进入我的Gallery页面。单击左上方“创建资产”，选择“数据集”。在“创建数据集”弹窗中配置参数，单击“创建”。表1 创建数据集参数名称说明英文名称必填项，数据集的英文名称。如果没有填写“中文名称”，则资产发布后，在数据集页签上会显示该“英文名称”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
作业状态参考 - AI开发平台ModelArts

JOBSTAT_SUBMIT_MODEL_FAILED，提交模型失败。 17 JOBSTAT_DEPLOY_SERVICE_FAILED，部署服务失败。 18 JOBSTAT_CHECK_INIT,审核作业初始化。 19 JOBSTAT_CHECK_RUNNING，审核作业正在运行中。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版）

总条数： 1284

上一页
1
...
55
56
57
...
65
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在ModelArts控制台查看监控指标 - AI开发平台ModelArts

日志提示“pandas.errors.ParserError: Error tokenizing data. C error: Expected .* fields” - AI开发平台ModelArts

日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

AI开发基本流程介绍 - AI开发平台ModelArts

发布本地AI应用到AI Gallery - AI开发平台ModelArts

（可选）Session鉴权 - AI开发平台ModelArts

创建Standard专属资源池 - AI开发平台ModelArts

Finetune训练 - AI开发平台ModelArts

Pytorch1.0引擎提示“RuntimeError: std::exception” - AI开发平台ModelArts

Finetune训练 - AI开发平台ModelArts

查询开发环境实例列表 - AI开发平台ModelArts

日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” - AI开发平台ModelArts

查看Notebook实例事件 - AI开发平台ModelArts

新建Workflow工作流 - AI开发平台ModelArts

数据保护技术 - AI开发平台ModelArts

日志提示“ Network is unreachable” - AI开发平台ModelArts

查询模型对象列表 - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

托管数据集到AI Gallery - AI开发平台ModelArts

作业状态参考 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线