搜索_华为云

获取训练作业支持的公共规格 - AI开发平台ModelArts

Integer 可以选择的最大节点数量（max_num，为1代表不支持分布式）。 cpu Cpu object cpu规格信息。 gpu Gpu object gpu规格信息。 npu Npu object Ascend规格信息。 memory Memory object 内存信息。 disk

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
使用kv-cache-int8量化 - AI开发平台ModelArts

kv-cache-int8量化和FP16、BF16、AWQ、smoothquant的组合。 kv-cache-int8量化支持的模型请参见表3。 Step1使用tensorRT量化工具进行模型量化，必须在GPU环境使用tensorRT 0.9.0版本工具进行模型量化，工具下载使

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

d官网。 TensorBoard可视化训练作业，当前仅支持基于TensorFlow、PyTorch版本镜像，CPU/GPU规格的资源类型。请根据实际局点支持的镜像和资源规格选择使用。前提条件为了保证训练结果中输出Summary文件，在编写训练脚本时，您需要在脚本中添加收集Summary相关代码。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
训练作业的自定义镜像制作流程 - AI开发平台ModelArts

案例参考：从0制作自定义镜像用于创建训练作业（PyTorch+CPU/GPU）从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU）从0制作自定义镜像用于创建训练作业（Tensorflow+GPU）从0制作自定义镜像用于创建训练作业（MindSpore+Ascend）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
查询服务详情 - AI开发平台ModelArts

eady时的解释原因。 predict_url String 在该节点的预测URL。 enable_gpu Boolean 是否开启GPU。 gpu_num Integer gpu个数。 host_ips Array of strings 节点主机IP。 updated_at String

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
查询Notebook支持的可切换规格列表 - AI开发平台ModelArts

unit_num Integer 计费单元。表7 GPUInfo 参数参数类型描述 gpu Integer GPU卡数。 gpu_memory String GPU内存。 type String GPU类型。请求示例 GET https://{endpoint}/v1/{proje

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
约束与限制 - AI开发平台ModelArts

Gallery中订阅的算法不支持另存为新算法。训练作业卡死检测目前仅支持资源类型为GPU的训练作业。仅使用新版专属资源池训练时才支持设置训练作业优先级。公共资源池和旧版专属资源池均不支持设置训练作业优先级。仅支持PyTorch和MindSpore框架的分布式训练和调测，如果MindSpore要进行多机分布式训练调试，则每台机器上都必须有8张卡。

帮助中心 > AI开发平台ModelArts > 产品介绍
不同机型的对应的软件配套版本 - AI开发平台ModelArts

gpuDriver gpu-driver 515.65.01（推荐） 510.47.03 470.182.03 470.57.02 无约束 GPU 用于升级、回滚gpu驱动，插件依赖gpu-beta版本。 ccePlugin gpu-beta 2.6.4（推荐） v1.28.* GPU 支持在容器中使用GPU显卡的设备管理插件。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
推理精度测试 - AI开发平台ModelArts

的精度验证，建议使用开源MME数据集和工具（GitHub - BradyFU/Awesome-Multimodal-Large-Language-Models at Evaluation）。配置需要使用的NPU卡，例如：实际使用的是第1张和第2张卡，此处填写为“0,1”，以此类推。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
ModelArts训练中不同规格资源“/cache”目录的大小是多少？ - AI开发平台ModelArts

0.9”。裸机的本地磁盘为物理磁盘，无法扩容，如果存储的数据量大，建议使用SFS存放数据，SFS支持扩容。 GPU规格的资源表1 GPU cache目录容量 GPU规格 cache目录容量 GP Vnt1 800G 8*GP Vnt1 3T GP Pnt1 800G CPU规格的资源

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
推理精度测试 - AI开发平台ModelArts

的精度验证，建议使用开源MME数据集和工具（GitHub - BradyFU/Awesome-Multimodal-Large-Language-Models at Evaluation）。配置需要使用的NPU卡，例如：实际使用的是第1张和第2张卡，此处填写为“0,1”，以此类推。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
查询模型runtime - AI开发平台ModelArts

13-python3.6-gpu", "tf1.13-python3.7-cpu", "tf1.13-python3.7-gpu", "python3.6", "tf1.13-python3.7-aiflow-gpu", "tf1.13-python3.7-gpu-async", "tensorflow_2

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
创建Standard专属资源池 - AI开发平台ModelArts

RM。如果选择了多个GPU或NPU规格，由于不同规格的参数网络平面不互通，分布式训练时训练速度会受到影响。如果您要做分布式训练，建议您只选择一个GPU或NPU规格。一个资源池中，最多可添加10种规格。资源调度与切分自定义驱动默认关闭。部分GPU和Ascend规格资源池允

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
Standard资源池功能介绍 - AI开发平台ModelArts

专属资源池支持打通用户的网络，在该专属资源池中运行的作业可以访问打通网络中的存储和资源。例如，在创建训练作业时选择打通了网络的专属资源池，训练作业创建成功后，支持在训练时访问SFS中的数据。专属资源池支持自定义物理节点运行环境相关的能力，例如GPU/Ascend驱动的自助升级，而公共资源池暂不支持。专属资源池使用说明

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
历史待下线案例 - AI开发平台ModelArts

PyCharm插件调试训练ResNet50图像分类模型示例：从 0 到 1 制作自定义镜像并用于训练（PyTorch+CPU/GPU）示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU）使用ModelArts Standard一键完成商超商品识别模型部署专属资源池训练

 帮助中心 > AI开发平台ModelArts > 最佳实践
kv-cache-int8量化 - AI开发平台ModelArts

int8_pertoken #只支持int8，表示kvint8 per-token量化 per-tensor静态量化场景在GPU机器上使用tensorRT 0.9.0版本工具进行模型量化，工具下载使用指导请参见https://github.com/NVIDIA/TensorRT-LLM/tree/v0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
推理精度测试 - AI开发平台ModelArts

的精度验证，建议使用开源MME数据集和工具（GitHub - BradyFU/Awesome-Multimodal-Large-Language-Models at Evaluation）。配置需要使用的NPU卡，例如：实际使用的是第1张和第2张卡，此处填写为“0,1”，以此类推。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
推理精度测试 - AI开发平台ModelArts

的精度验证，建议使用开源MME数据集和工具（GitHub - BradyFU/Awesome-Multimodal-Large-Language-Models at Evaluation）。配置需要使用的NPU卡，例如：实际使用的是第1张和第2张卡，此处填写为“0,1”，以此类推。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
yaml配置文件参数配置说明 - AI开发平台ModelArts

可选项。用于指定DeepSpeed的配置文件相对或绝对路径。DeepSpeed是一个开源库，用于加速深度学习训练。通过使用DeepSpeed，可以实现如混合精度训练、ZeRO内存优化等高级特性，以提高训练效率和性能 stage sft 表示训练类型。可选择值：[pt、sf、rm、ppo]，pt代

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
如何安装第三方包，安装报错的处理方法 - AI开发平台ModelArts

whl”文件无法安装，在启动文件中添加如下代码，查看当前pip命令支持的文件名和版本。 import pip print(pip.pep425tags.get_supported()) 获取到支持的文件名和版本如下： [('cp36', 'cp36m', 'manylinux1_x86_64')

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障

总条数： 618

上一页
1
...
12
13
14
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

获取训练作业支持的公共规格 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

训练作业的自定义镜像制作流程 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

查询Notebook支持的可切换规格列表 - AI开发平台ModelArts

约束与限制 - AI开发平台ModelArts

不同机型的对应的软件配套版本 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

ModelArts训练中不同规格资源“/cache”目录的大小是多少？ - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

查询模型runtime - AI开发平台ModelArts

创建Standard专属资源池 - AI开发平台ModelArts

Standard资源池功能介绍 - AI开发平台ModelArts

历史待下线案例 - AI开发平台ModelArts

kv-cache-int8量化 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

yaml配置文件参数配置说明 - AI开发平台ModelArts

如何安装第三方包，安装报错的处理方法 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线