搜索_华为云

创建数据集标签 - AI开发平台ModelArts

内置属性：三元组关系标签的起始实体类型，创建关系标签时必须指定，该参数仅文本三元组数据集使用。 @modelarts:rename_to 否 String 内置属性：重命名后的标签名。 @modelarts:shortcut 否 String 内置属性：标签快捷键，默认为空。例如：“D”。 @modelarts:to_type

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备AscendSpeed训练代码。准备镜像准备训练模型适用的容器镜像。准备Notebook 本案例需要创建一个Notebook，以便能够通过它访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS Turbo中的数据执行编辑操作。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
模型包结构介绍 - AI开发平台ModelArts

推荐采用相对导入方式导入自定义包。 customize_service.py依赖的其他文件可以直接放model目录下，需要采用绝对路径方式访问。绝对路径获取请参考绝对路径如何获取。 ModelArts针对多种引擎提供了样例及其示例代码，您可以参考样例编写您的配置文件和推理代码，详

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
模型训练计费项 - AI开发平台ModelArts

按文件系统所占用的存储空间容量和使用时长收费存储空间费用=每GB费率*存储容量*使用时长事件通知（不开启则不计费）订阅消息使用消息通知服务，在事件列表中选择特定事件，在事件发生时发送消息通知。如果想使用消息通知，需要在创建训练作业时开启“事件通知”功能。具体计费可见消息通知服务价格详情。按实际用量付费

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
执行训练任务（历史版本） - AI开发平台ModelArts

的值进行整除。 Step4 开启训练故障自动重启功能创建训练作业时，可开启自动重启功能。当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图3 开启故障重启断点续训练是通过ch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
Notebook Cache盘告警上报 - AI开发平台ModelArts

”。监控对象设置完成后，选择“统计方式”和“统计周期”。 “告警条件设置”：触发条件根据实际需求设置。图1 监控对象指标设置图2 设置指标统计方式图3 告警条件设置设置告警通知，单击“立即创建”。 “告警方式”：选择“直接告警” “行动规则”：开启开关，选择已创建的行动

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
查询Notebook支持的可切换规格列表 - AI开发平台ModelArts

1, "size" : 2, "total" : 2 } 状态码状态码描述 200 OK 401 Unauthorized 403 Forbidden 404 Not Found 错误码请参见错误码。父主题：开发环境管理

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
发布Workflow到ModelArts - AI开发平台ModelArts

布Workflow至运行态后，需要在Workflow页面配置输入输出等参数；而发布Workflow至运行态并运行通过对代码进行改造，用户直接在SDK侧发布并运行工作流，节省了前往控制台进行配置运行的操作。发布Workflow至运行态工作流编写完成后，可以进行固化保存，调用Wo

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow
查询数据集列表 - AI开发平台ModelArts

dataset_version 否 String 数据集版本（用于区分标注任务解耦前的数据集和解耦后的数据集）。可选值如下： v1：数据集与标注任务解耦前的数据集（默认值） v2：数据集与标注任务解耦后的数据集 all：所有数据集请求参数无响应参数状态码： 200 表3 响应Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

镜像适配的Cann版本是cann_8.0.rc3。 Lite Server驱动版本要求23.0.6 PyTorch版本：2.1.0 确保容器可以访问公网。文档更新内容 6.3.909版本相对于6.3.908版本新增如下内容：文档中新增对Llama3.1的适配。 ModelLink框

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909）
准备镜像环境 - AI开发平台ModelArts

模型镜像版本模型版本 CANN cann_8.0.RC3 驱动 23.0.6 PyTorch 2.3.1 步骤一：检查环境 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info # 在每个实例节点上运行此命令可以看到NPU卡状态

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作
部署在线服务 - AI开发平台ModelArts

b Service，并且提供在线的测试UI与监控能力，服务一直保持运行。 batch为批量服务，批量服务可对批量数据进行推理，完成数据处理后自动停止。 edge表示边缘服务，通过华为云智能边缘平台，在边缘节点将模型部署为一个Web Service，需提前在IEF（智能边缘服务）创建好节点。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

在“规格确认”页面，确认训练作业的参数信息，确认无误后单击“提交”。训练作业创建完成后，后台将自动完成容器镜像下载、代码目录下载、执行启动命令等动作。训练作业一般需要运行一段时间，根据您的训练业务逻辑和选择的资源不同，训练时长将持续几十分钟到几小时不等。训练作业执行成功后，日志信息如图1所示。图1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

Step6 在ModelArts上创建训练作业登录ModelArts管理控制台，检查当前账号是否已完成访问授权的配置。如未完成，请参考使用委托授权。针对之前使用访问密钥授权的用户，建议清空授权，然后使用委托进行授权。在ModelArts管理控制台，左侧导航栏中选择“训练管理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
推理性能测试 - AI开发平台ModelArts

式启动服务，API接口公网地址与"/v1/completions"拼接而成。部署成功后的在线服务详情页中可查看API接口公网地址。图1 API接口公网地址 --app-code：获取方式见访问在线服务（APP认证）。 --tokenizer：tokenizer路径，Huggin

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
多模态 - AI开发平台ModelArts
多模态 - AI开发平台ModelArts

存时扩展它的大小。开启时可能提升模型性能。报错则关闭。 --model ${container_model_path}：模型地址，模型格式是HuggingFace的目录格式。即上传的HuggingFace权重文件存放目录。如果使用了量化功能，则使用量化章节转换后的权重。如果使用的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
执行训练任务【旧】 - AI开发平台ModelArts

0_pl_sft_13b.sh 创建训练作业时，可开启自动重启功能。当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图2 开启故障重启断点续训练是通过checkpoint机制实

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
查看Notebook实例事件 - AI开发平台ModelArts

%s updated the instance keypair from %s to %s）重要 UpdateWhitelist 更新实例访问白名单重要 UpdateHook 更新自定义脚本重要 UpdateStorageSizeFailed 资源售罄引起的实例存储扩容失败（The

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
删除网络资源 - AI开发平台ModelArts

Turbo的连接状态信息。可选值如下： Active：SFS连通状态正常 Abnormal：SFS连通状态异常 ipAddr String SFS Turbo的访问地址。状态码：404 表13 响应Body参数参数参数类型描述 error_code String ModelArts错误码。 error_msg

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
使用DCGM监控Lite Server资源 - AI开发平台ModelArts

-p 3000:3000 grafana/grafana-oss 在BMS页面打开Grafana所在节点的安全组配置，添加入方向规则，允许外部访问3000、9090端口：在浏览器地址栏输入xx.xx.xx.xx:3000，登录Grafana，默认账号密码为：admin/admin。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源

总条数： 934

上一页
1
...
33
34
35
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建数据集标签 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

模型包结构介绍 - AI开发平台ModelArts

模型训练计费项 - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

Notebook Cache盘告警上报 - AI开发平台ModelArts

查询Notebook支持的可切换规格列表 - AI开发平台ModelArts

发布Workflow到ModelArts - AI开发平台ModelArts

查询数据集列表 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

多模态 - AI开发平台ModelArts

执行训练任务【旧】 - AI开发平台ModelArts

查看Notebook实例事件 - AI开发平台ModelArts

删除网络资源 - AI开发平台ModelArts

使用DCGM监控Lite Server资源 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线