搜索_华为云

配置Lite Cluster存储 - AI开发平台ModelArts

从Pod的生命周期，与Pod一起创建和删除。使用临时存储路径 HostPath 适用于以下场景：容器工作负载程序生成的日志文件需要永久保存。需要访问宿主机上Docker引擎内部数据结构的容器工作负载。节点存储。多个容器可能会共享这一个存储，会存在写冲突的问题。 Pod删除后，存储不会清理。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
MoXing Framework功能介绍 - AI开发平台ModelArts

file则需要如下代码： 1 2 import moxing as mox mox.file.list_directory('obs://bucket_name/my_dir/') 引入MoXing Framework模块使用MoXing Framework前，您需要在代码的开头先引入MoXing

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
推理精度测试 - AI开发平台ModelArts

conda activate python-3.9.10 （可选）如果需要在humaneval数据集上评估模型代码能力，请执行此步骤，否则忽略这一步。原因是通过opencompass使用humaneval数据集时，需要执行模型生成的代码。请仔细阅读human_eval/execution

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
推理精度测试 - AI开发平台ModelArts

conda activate python-3.9.10 （可选）如果需要在humaneval数据集上评估模型代码能力，请执行此步骤，否则忽略这一步。原因是通过opencompass使用humaneval数据集时，需要执行模型生成的代码。请仔细阅读human_eval/execution

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
工具介绍及准备工作 - AI开发平台ModelArts

配置。目前仅支持SFT指令监督微调训练阶段。代码目录 benchmark工具脚本存放在代码包AscendCloud-LLM-xxx.zip的LLM/LLaMAFactory/benchmark目录下，包含训练性能测试和训练精度测试脚本。代码目录如下: benchmark ├──

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
Lite Cluster使用流程 - AI开发平台ModelArts

云服务中。当您需要使用集群资源时，可以使用kubectl工具或k8s API来下发作业。此外，ModelArts还提供了扩缩容、驱动升级等功能，方便您对集群资源进行管理。图2 使用流程推荐您根据以下使用流程对Lite Cluster进行使用。资源开通：您需要开通资源后才可使用Lite

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

3551：到obs检查输入数据目录是否存在，如果不存在，请按照实际需要创建obs目录；如果检查发现目录存在，但依然报同样的错，可以提工单申请技术支持 ModelArts.3567：用户只能访问自己账号下的obs目录，ModelArts在读取其他用户obs下的数据时，需要用户委托权限，没有创建委托，就没有权限使用其他用户obs中的数据。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
工具介绍及准备工作 - AI开发平台ModelArts

配置。目前仅支持SFT指令监督微调训练阶段。代码目录 benchmark工具脚本存放在代码包AscendCloud-LLM-xxx.zip的LLM/LLaMAFactory/benchmark目录下，包含训练性能测试和训练精度测试脚本。代码目录如下: benchmark ├──

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练benchmark工具
创建自动模型优化的训练作业 - AI开发平台ModelArts

04-x86_64，并且优化的超参类型为float类型，ModelArts支持用户使用超参搜索功能。在0代码修改的基础下，实现算法模型的超参搜索。需要完成以下步骤：准备工作创建算法创建训练作业查看超参搜索作业详情准备工作数据已完成准备：已在ModelArts中创建可用的数据集

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 自动模型优化（AutoSearch）
实时推理的部署及使用流程 - AI开发平台ModelArts

当前ModelArts支持访问在线服务的认证方式有以下方式（案例中均以HTTPS请求为例）： Token认证：Token具有时效性，有效期为24小时，需要使用同一个Token鉴权时，可以缓存起来，避免频繁调用。 AK/SK认证：使用AK/SK对请求进行签名，在请求时将签名信息添加到消息头，从

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
单机多卡 - AI开发平台ModelArts
单机多卡 - AI开发平台ModelArts

单机多卡准备镜像上传数据和算法至SFS（首次使用时需要）使用Notebook进行代码调试创建训练任务父主题：调试与训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练
使用MaaS调优模型 - AI开发平台ModelArts

在“我的模型”页面存在已创建成功的模型。已准备好训练数据集，并存放于OBS桶中，OBS桶必须和MaaS服务在同一个Region下。当需要永久保存日志时，需要准备好存放日志的OBS路径，OBS桶必须和MaaS服务在同一个Region下。创建调优作业登录ModelArts Studio控制台，在顶部导航栏选择目标区域。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
多机多卡 - AI开发平台ModelArts
多机多卡 - AI开发平台ModelArts

多机多卡线下容器镜像构建及调试上传数据至OBS（首次使用时需要）上传算法至SFS 创建训练任务父主题：调试与训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

使用PyCharm远程连接Notebook 使用PyCharm提交训练作业操作指导 12:29 使用PyCharm提交训练作业为什么需要云上AI开发视频介绍 06:30 为什么需要云上AI开发云上AI开发-调试代码操作指导 23:43 云上AI开发-Notebook调试代码云上AI开发-运行训练作业

 帮助中心 > AI开发平台ModelArts > 视频帮助
CUDA和CUDNN - AI开发平台ModelArts
CUDA和CUDNN - AI开发平台ModelArts

33以下）配合使用时，可能会出现兼容问题，此时需要使用CUDA Compatibility。在创建训练页面添加以下环境变量： export LD_LIBRARY_PATH=/usr/local/cuda/compat 训练时默认不需要加此环境变量，仅当发现驱动版本不够时才使用此方法。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
Notebook自定义镜像故障基础排查 - AI开发平台ModelArts

run启动，无法正常运行；用户自行安装了Jupyterlab服务导致冲突的，需要用户本地使用Jupyterlab命令罗列出相关的静态文件路径，删除并且卸载镜像中的Jupyterlab服务；用户自己业务占用了开发环境官方的8888、8889端口的，需要用户修改自己的进程端口号；用户的镜像指定了PYTHONPATH、sys

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
升级Lite Cluster资源池驱动 - AI开发平台ModelArts

存量作业运行完成后再进行升级，因需要等待作业完成，故升级周期可能比较长。强制升级：忽略资源池中正在运行的作业，直接进行驱动升级，可能会导致运行中作业失败，需谨慎选择。约束限制 Lite Cluster资源池状态处于运行中，且专属池中的节点需要含有GPU/Ascend资源。资源池驱动升级操作

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
AI开发基本流程介绍 - AI开发平台ModelArts

的开发者基于主流AI引擎，开发并训练其业务所需的模型。评估模型训练得到模型之后，整个开发过程还不算结束，需要对模型进行评估和考察。经常不能一次性获得一个满意的模型，需要反复的调整算法参数、数据，不断评估训练生成的模型。一些常用的指标，如准确率、召回率、AUC等，能帮助您有效的评估，最终获得一个满意的模型。

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
单机单卡 - AI开发平台ModelArts
单机单卡 - AI开发平台ModelArts

单机单卡线下容器镜像构建及调试上传镜像上传数据和算法至OBS（首次使用时需要）使用Notebook进行代码调试创建训练任务监控资源父主题：调试与训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练
ModelArts Standard使用流程 - AI开发平台ModelArts

Standard支持公共资源池和专属资源池。公共资源池：方便快捷，无需创建，创建训练推理任务时直接选择即可。此时，忽略此步骤。专属资源池：用户独占资源，需要先购买创建。如果使用专属资源池，需要完成此步骤。创建Standard专属资源池准备数据（可选）创建数据集 ModelArts Standard提供了数

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）

总条数： 1903

上一页
1
...
83
84
85
...
96
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置Lite Cluster存储 - AI开发平台ModelArts

MoXing Framework功能介绍 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

工具介绍及准备工作 - AI开发平台ModelArts

Lite Cluster使用流程 - AI开发平台ModelArts

批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

工具介绍及准备工作 - AI开发平台ModelArts

创建自动模型优化的训练作业 - AI开发平台ModelArts

实时推理的部署及使用流程 - AI开发平台ModelArts

单机多卡 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

多机多卡 - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

CUDA和CUDNN - AI开发平台ModelArts

Notebook自定义镜像故障基础排查 - AI开发平台ModelArts

升级Lite Cluster资源池驱动 - AI开发平台ModelArts

AI开发基本流程介绍 - AI开发平台ModelArts

单机单卡 - AI开发平台ModelArts

ModelArts Standard使用流程 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线