搜索_华为云

附录：指令微调训练常见问题 - AI开发平台ModelArts

问题2：访问容器目录时提示Permission denied 由于在容器中没有相应目录的权限，会导致访问时提示Permission denied。可以在宿主机中对相关目录做权限放开，执行命令如下。 chmod 777 -R ${dir} 问题3：训练过程报错：ImportError: This modeling

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
PD分离部署使用说明 - AI开发平台ModelArts

用显卡资源，建议增加1个容器，也可以在全量推理或增量推理的容器上启动。约束限制全量和增量节点的local rank table必须一一对应。全量和增量节点不能使用同一个端口。 scheduler实例中NODE_PORTS=8088,8089；端口设置顺序必须与global rank

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
部署的在线服务状态为告警 - AI开发平台ModelArts

解决方法使用状态为告警的服务进行预测，可能存在预测失败的风险，请从以下4个角度进行排查，并重新部署。后台预测请求过多。如果您使用API接口进行预测，请检查是否预测请求过多。大量的预测请求会导致部署的在线服务进入告警状态。业务内存不正常。请检查推理代码是否存在内存溢出或者内存泄漏的问题。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
查询服务详情 - AI开发平台ModelArts

可通过查询服务列表接口获取当前用户拥有的服务，其中service_id字段即为服务ID。请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
更新服务配置 - AI开发平台ModelArts

String> 运行模型需要的环境变量键值对，可选填，默认为空。 src_path 是 String 批量任务输入数据的OBS路径。 dest_path 是 String 批量任务输出结果的OBS路径。 req_uri 是 String 批量任务中调用的推理接口，需要从模型的config.j

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
按需计费 - AI开发平台ModelArts
按需计费 - AI开发平台ModelArts

+ 2746 ）/ 3600 ）小时 = 2.70 元本文价格仅供参考，实际计算请以ModelArts价格详情中的价格为准。变更配置后对计费的影响如果您在购买按需计费资源池后变更了规格配置，会产生一个新订单并开始按新配置的价格计费，旧订单自动失效。如果您在一个小时内变更了

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
免费资产和商用资产 - AI开发平台ModelArts

云商店当前付费商品默认发布后是隐藏商品，在Gallery首页将不可见，只有在云商店卖家中心改变商品为非隐藏，Gallery首页付费资产列表才对该商品可见。更多关于商业售卖商品的使用指导请参见《云商店用户指南》，商业售卖商品在华为云云商店的使用流程如下：图2 华为云云商店商业商品

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

像装了多个python，需要设置python路径的环境变量）。测试训练启动脚本。优先使用手工进行数据复制的工作并验证一般在镜像里不包含训练所用的数据和代码，所以在启动镜像以后需要手工把需要的文件复制进去。建议数据、代码和中间数据都放到"/cache"目录，防止正式运行时磁盘

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
模型包结构介绍 - AI开发平台ModelArts

saved_model.pb 必选: protocol buffer格式文件，包含该模型的图描述 | │ ├── variables 对*.pb模型主文件而言必选；固定子目录名称，包含模型的权重偏差等信息 | │ │ ├── variables.index 必选 |

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
训练的数据集预处理说明 - AI开发平台ModelArts

GeneralPretrainHandler解析 GeneralPretrainHandler是处理预训练数据集的一个类，继承自BaseDatasetHandler，实现对alpaca格式预训练数据集的处理。 def _filter(self, sample): sample = self._pre_process(sample)

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
推理服务精度评测 - AI开发平台ModelArts

推理服务精度评测本章节介绍了2种精度测评方式，分别为Lm-eval工具和MME工具。 lm-eval工具适用于语言模型的推理精度测试，数据集包含mmlu、ARC_Challenge、GSM_8k、Hellaswag、Winogrande、TruthfulQA等，该工具为离线测评，不需要启动推理服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

下载方式：选择“对象存储服务（OBS）” 目标区域：选择“华北-北京四”（即要部署服务的云服务区）目标位置：请选择一个空的OBS目录，本示例为“/test-modelartsz/dataset-flower/” 此处从AI Gallery下载并使用数据集是限时免费的，但数据集存储在OBS，

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
配置Workflow的输入输出目录 - AI开发平台ModelArts

定义一个只包含job_step的工作流 workflow = wf.Workflow( name="test-workflow", desc="this is a test workflow", steps=[job_step], storages=[input_storage

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

int(train_samples / 2) val_label = [1] * int(test_samples / 2) + [0] * int(test_samples / 2) random.seed(2021) random

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？场景描述本文指导如何进行节点内NVLINK带宽性能测试，适用的环境为：Ant8或者Ant1 GPU裸金属服务器，且服务器中已经安装相关GPU驱动软件，以及Pytorch2.0。 GPU A系列裸金属服务器

 帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
训练性能测试 - AI开发平台ModelArts

训练性能测试流程图训练性能测试流程图如下图所示：图1 训练性能测试流程执行性能比较脚本完成benchmark启动任务。进入test-benchmark目录执行命令。 ascendfactory-cli performance <cfgs_yaml_file> --baseline

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练benchmark工具
附录：微调训练常见问题 - AI开发平台ModelArts

denied。可以在宿主机中对相关目录做权限放开，执行命令如下。 chmod 777 -R ${dir} 问题3：训练过程报错：ImportError: XXX not found in your environment: flash_attn 根因：昇腾环境暂时不支持flash_attn接口规避措

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

根据您选择的元模型存储路径，将自动关联出元模型使用的“AI引擎”。 “容器调用接口” 当“AI引擎”选择“Custom”时，才会显示该参数。模型提供的推理接口所使用的协议和端口号，缺省值是HTTPS和8080，端口和协议需要根据模型实际定义的推理接口进行配置。 “健康检查” 用于指定模型的健康检查。使用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
查询Workflow Execution - AI开发平台ModelArts

查询Workflow Execution 功能介绍通过ID查询Workflow Execution详情。接口约束无调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
删除Workflow Execution - AI开发平台ModelArts

删除Workflow Execution 功能介绍通过ID删除Workflow Execution。接口约束无调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI DELETE

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理

总条数： 837

上一页
1
...
21
22
23
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

附录：指令微调训练常见问题 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

部署的在线服务状态为告警 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

按需计费 - AI开发平台ModelArts

免费资产和商用资产 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

模型包结构介绍 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

推理服务精度评测 - AI开发平台ModelArts

使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

配置Workflow的输入输出目录 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

附录：微调训练常见问题 - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

查询Workflow Execution - AI开发平台ModelArts

删除Workflow Execution - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线