搜索_华为云

ModelArts训练中不同规格资源“/cache”目录的大小是多少？ - AI开发平台ModelArts

议使用SFS存放数据，SFS支持扩容。 GPU规格的资源表1 GPU cache目录容量 GPU规格 cache目录容量 GP Vnt1 800G 8*GP Vnt1 3T GP Pnt1 800G CPU规格的资源表2 CPU cache目录容量 CPU规格 cache目录容量

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
添加资源标签 - AI开发平台ModelArts

oken接口获取（响应消息头中X-Subject-Token的值）。表3 请求Body参数参数是否必选参数类型描述 tags 是 Array of TmsTag objects TMS标签列表。表4 TmsTag 参数是否必选参数类型描述 key 是 String

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

准备数据本教程使用到的训练数据集是Alpaca数据集。您也可以自行准备数据集。数据集下载本教程使用Alpaca数据集，数据集的介绍及下载链接如下。 Alpaca数据集是由OpenAI的text-davinci-003引擎生成的包含52k条指令和演示的数据集。这些指令数据可以

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
启动团队标注任务 - AI开发平台ModelArts

或指定团队自行分配。表3 WorkforcesConfig 参数是否必选参数类型描述 agency 否 String 管理员。 workforces 否 Array of WorkforceConfig objects 执行标注任务的团队列表。表4 WorkforceConfig

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
管理Workflow Execution - AI开发平台ModelArts

是否使用的是缓存。表13 WorkflowConditionExecution 参数参数类型描述 result String 执行结果。 metric_list Array of WorkflowMetricPair objects 工作流度量信息列表。表14 WorkflowMetricPair

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
创建团队标注任务 - AI开发平台ModelArts

是否同步更新新增数据表3 WorkforcesConfig 参数是否必选参数类型描述 agency 否 String 管理员。 workforces 否 Array of WorkforceConfig objects 执行标注任务的团队列表。表4 WorkforceConfig

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
语言模型推理性能测试 - AI开发平台ModelArts

可以根据实际需求设置。 --num-requests：输出数据集的数量，可以根据实际需求设置。进入benchmark_tools目录下，切换一个conda环境。 cd benchmark_tools conda activate python-3.9.10 执行脚本benchmark_serving

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试
使用DCGM监控Lite Server资源 - AI开发平台ModelArts

使用DCGM监控Lite Server资源场景描述本文主要介绍如何在Lite Server上配置DCGM监控，用于监控Lite Server上的GPU资源。 DCGM是用于管理和监控基于Linux系统的NVIDIA GPU大规模集群的一体化工具，提供多种能力，包括主动健康监控

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
模型管理 - AI开发平台ModelArts
模型管理 - AI开发平台ModelArts

ModelArts日志查询界面看到日志通过OBS创建模型时，构建日志中提示pip下载包失败通过自定义镜像创建模型失败导入模型后部署服务，提示磁盘不足创建模型成功后，部署服务报错，如何排查代码问题自定义镜像导入配置运行时依赖无效通过API接口查询模型详情，model_name返回值出现乱码

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
昇腾云服务6.3.912版本说明 - AI开发平台ModelArts

算子依赖包：AscendCloud-OPP 获取路径：Support-E，在此路径中查找下载ModelArts 6.3.912 版本。说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。支持的特性表1 本版本支持的特性说明分类软件包特性说明参考文档

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
剪枝 - AI开发平台ModelArts
剪枝 - AI开发平台ModelArts

剪枝什么是剪枝剪枝是一种大模型压缩技术的关键技术，旨在保持推理精度的基础上，减少模型的复杂度和计算需求，以便大模型推理加速。剪枝的一般步骤是：1、对原始模型调用不同算法进行剪枝，并保存剪枝后的模型；2、使用剪枝后的模型进行推理部署。常用的剪枝技术包括：结构化稀疏剪枝、半结构化稀疏剪枝、非结构化稀疏剪枝。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
修改Workflow工作流 - AI开发平台ModelArts

Array of Scene objects 场景。表28 Scene 参数参数类型描述 id String 场景ID。 name String 场景名称。 steps Array of strings 节点列表。表29 WorkflowServicePackege 参数

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
推理场景介绍 - AI开发平台ModelArts

不同软件版本对应的基础镜像地址不同，请严格按照软件版本和镜像配套关系获取基础镜像。支持的模型列表和权重文件本方案支持vLLM的v0.3.2版本。不同vLLM版本支持的模型列表有差异，具体如表3所示。表3 支持的模型列表和权重获取地址序号模型名称支持vLLM v0.3.2 开源权重获取地址

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
系统容器异常退出 - AI开发平台ModelArts

系统容器异常退出问题现象在训练创建后出现“系统容器异常退出”的故障。 [ModelArts Service Log]2022-10-11 19:18:23,267 - file_io.py[1ine:748] - ERROR: stat:404 errorCode:NoSuchKey

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

适配的CANN版本是cann_8.0.rc2，驱动版本是23.0.5。本案例仅支持在专属资源池上运行。支持的模型列表本方案支持的模型列表、对应的开源权重获取地址如表1所示。表1 支持的模型列表和权重获取地址序号支持模型支持模型参数量开源权重获取地址 1 Llama llama-7b https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
训练作业的监控内存指标持续升高直至作业失败 - AI开发平台ModelArts

训练作业的监控内存指标持续升高直至作业失败问题现象训练作业的“状态”为“运行失败”。原因分析训练作业的监控内存指标持续升高，导致最后训练作业失败。处理步骤查询训练作业的日志和监控信息，是否存在明确的OOM报错信息。是，训练作业的日志里存在OOM报错，执行2。否，训练作业的日志里没有OOM报错，但是存在监控指标异常，执行3。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
批量重启节点 - AI开发平台ModelArts

nodes/batch-reboot 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 资源池名称。请求参数表2 请求Body参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
训练场景和方案介绍 - AI开发平台ModelArts

资源和Ascend Snt9B。软件配套版本表1 获取软件分类名称获取路径插件代码包 AscendCloud-6.3.908软件包中的AscendCloud-AIGC-6.3.908-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
节点池管理 - AI开发平台ModelArts

节点池管理查询OS的配额

 帮助中心 > AI开发平台ModelArts > API参考
训练场景和方案介绍 - AI开发平台ModelArts

资源和Ascend Snt9B。软件配套版本表1 获取软件分类名称获取路径插件代码包 AscendCloud-6.3.908软件包中的AscendCloud-AIGC-6.3.908-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）

总条数： 1766

上一页
1
...
81
82
83
...
89
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts训练中不同规格资源“/cache”目录的大小是多少？ - AI开发平台ModelArts

添加资源标签 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

启动团队标注任务 - AI开发平台ModelArts

管理Workflow Execution - AI开发平台ModelArts

创建团队标注任务 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

使用DCGM监控Lite Server资源 - AI开发平台ModelArts

模型管理 - AI开发平台ModelArts

昇腾云服务6.3.912版本说明 - AI开发平台ModelArts

剪枝 - AI开发平台ModelArts

修改Workflow工作流 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

系统容器异常退出 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

训练作业的监控内存指标持续升高直至作业失败 - AI开发平台ModelArts

批量重启节点 - AI开发平台ModelArts

训练场景和方案介绍 - AI开发平台ModelArts

节点池管理 - AI开发平台ModelArts

训练场景和方案介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线