搜索_华为云

BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明在大模型训练中，BF16（Brain Floating Point）和FP16（Float16）都是使用的半精度浮点数格式，但它们在结构和适用性上有一些重要的区别。 BF16：具有8个指数位和7个小数位。在处理大模型时有优势，能够避免在训练过程中数值的上溢

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明在大模型训练中，BF16（Brain Floating Point）和FP16（Float16）都是使用的半精度浮点数格式，但它们在结构和适用性上有一些重要的区别。 BF16：具有8个指数位和7个小数位。在处理大模型时有优势，能够避免在训练过程中数值的上溢

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
历史待下线案例 - AI开发平台ModelArts

PyCharm插件调试训练ResNet50图像分类模型示例：从 0 到 1 制作自定义镜像并用于训练（PyTorch+CPU/GPU）示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU）使用ModelArts Standard一键完成商超商品识别模型部署专属资源池训练

 帮助中心 > AI开发平台ModelArts > 最佳实践
推理服务精度评测 - AI开发平台ModelArts

dtype=auto,tensor_parallel_size=${tensor_parallel_size},gpu_memory_utilization=${gpu_memory_utilization},add_bos_token=True,max_model_len=${max_model_len}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
Standard资源池功能介绍 - AI开发平台ModelArts

专属资源池支持打通用户的网络，在该专属资源池中运行的作业可以访问打通网络中的存储和资源。例如，在创建训练作业时选择打通了网络的专属资源池，训练作业创建成功后，支持在训练时访问SFS中的数据。专属资源池支持自定义物理节点运行环境相关的能力，例如GPU/Ascend驱动的自助升级，而公共资源池暂不支持。专属资源池使用说明

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
如何安装第三方包，安装报错的处理方法 - AI开发平台ModelArts

whl”文件无法安装，在启动文件中添加如下代码，查看当前pip命令支持的文件名和版本。 import pip print(pip.pep425tags.get_supported()) 获取到支持的文件名和版本如下： [('cp36', 'cp36m', 'manylinux1_x86_64')

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
Yaml配置文件参数配置说明 - AI开发平台ModelArts

可选项。用于指定DeepSpeed的配置文件相对或绝对路径。DeepSpeed是一个开源库，用于加速深度学习训练。通过使用DeepSpeed，可以实现如混合精度训练、ZeRO内存优化等高级特性，以提高训练效率和性能 stage sft 表示当前的训练阶段。可选择值：【sft、rm、ppo、dpo】

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练脚本说明
查询开发环境实例详情 - AI开发平台ModelArts

"GPU": 1, "gpu_type": "v100NV32", "memory": "64GiB" }, "status": "onSale", "type": "GPU"

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
套餐包 - AI开发平台ModelArts
套餐包 - AI开发平台ModelArts

ModelArts提供了AI全流程开发的套餐包，面向有AI基础的开发者，提供机器学习和深度学习的算法开发及部署全功能，包含数据处理、模型开发、模型训练、模型管理和模型部署流程。约束限制套餐包在购买和使用时的限制如下：套餐包和购买时选定的区域绑定，套餐包只能使用于购买时选定的区域，且只能用于公

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
查询资源规格列表 - AI开发平台ModelArts

x86：x86架构 arm64：ARM架构 cpu String CPU核心数量。 memory String 内存大小，单位为Gi。 gpu gpu object GPU信息。 npu npu object NPU信息。 dataVolume Array of dataVolume objects

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
监控资源 - AI开发平台ModelArts
监控资源 - AI开发平台ModelArts

操作三：鼠标悬浮在图片上的时间节点，可查看对应时间节点的占用率情况。表1 参数说明参数说明 cpuUsage cpu使用率。 gpuMemUsage gpu内存使用率。 gpuUtil gpu使用情况。 memUsage 内存使用率。 npuMemUsage npu内存使用率。 npuUtil npu使用情况。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
ModelArts SDK、OBS SDK和MoXing的区别是什么？ - AI开发平台ModelArts

w、PyTorch、MXNet、MindSpore等深度学习引擎之上，使得这些计算引擎分布式性能更高，同时易用性更好。MoXing包含很多组件，其中MoXing Framework模块是一个基础公共组件，可用于访问OBS服务，和具体的AI引擎解耦，在ModelArts支持的所有A

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
Lite Cluster资源管理介绍 - AI开发平台ModelArts

Cluster资源池驱动：当资源池中的节点含有GPU/Ascend资源时，用户基于自己的业务，可能会有自定义GPU/Ascend驱动的需求，ModelArts面向此类客户提供了自助升级专属资源池GPU/Ascend驱动的能力。监控Lite Cluster资源：ModelArts支持使用AOM和Promethe

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
查询开发环境实例列表 - AI开发平台ModelArts

"multi engine, gpu, python 3.6 for notebook", "flavor_type": "GPU", "id": "Multi-Engine 1.0 (python3)-gpu",

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

iron(device_type="CPU")完成配置，环境中只需配置运行一次。 GPU环境，调用Model.configure_tf_infer_environ(device_type="GPU")完成配置，环境中只需配置运行一次。 1 2 3 4 5 6 7 8

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
查询插件模板 - AI开发平台ModelArts

project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 plugintemplate_name 是 String 插件模板的名称。可选值如下： gpu-driver：GPU驱动插件模板信息 npu-driver：NPU驱动插件模板信息请求参数无响应参数

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
更新开发环境实例信息 - AI开发平台ModelArts

"GPU": 1, "gpu_type": "v100NV32", "memory": "64GiB" }, "status": "onSale", "type": "GPU"

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
查询训练作业参数详情 - AI开发平台ModelArts

spec_code String 训练作业资源规格。 gpu_type String 资源规格gpu的类型。 create_time Long 训练作业参数创建时间。 cpu String 资源规格CPU内存。 gpu_num Integer 资源规格gpu的个数。 core String 资源规格的核数。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
开发环境的应用示例 - AI开发平台ModelArts

当Notebook实例不再需要时，调用删除Notebook实例接口删除实例。前提条件已获取IAM的EndPoint和ModelArts的EndPoint。确认服务的部署区域，获取项目ID和名称、获取帐号名和帐号ID和获取用户名和用户ID。操作步骤调用认证鉴权接口获取用户的Token。请求消息体： URI格式：POST

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
训练作业卡死检测 - AI开发平台ModelArts

查看当前moxing调用的接口版本：file_io._LARGE_FILE_METHOD，如果输出值为1则为V1版本，如果输出值为2，则为V2版本。 V1版本修改：file_io._NUMBER_OF_PROCESSES=1 V2版本修改：可以 file_io._LARGE_FILE_METHOD = 1，将模

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性

总条数： 601

上一页
1
...
13
14
15
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

历史待下线案例 - AI开发平台ModelArts

推理服务精度评测 - AI开发平台ModelArts

Standard资源池功能介绍 - AI开发平台ModelArts

如何安装第三方包，安装报错的处理方法 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

查询开发环境实例详情 - AI开发平台ModelArts

套餐包 - AI开发平台ModelArts

查询资源规格列表 - AI开发平台ModelArts

监控资源 - AI开发平台ModelArts

ModelArts SDK、OBS SDK和MoXing的区别是什么？ - AI开发平台ModelArts

Lite Cluster资源管理介绍 - AI开发平台ModelArts

查询开发环境实例列表 - AI开发平台ModelArts

在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

查询插件模板 - AI开发平台ModelArts

更新开发环境实例信息 - AI开发平台ModelArts

查询训练作业参数详情 - AI开发平台ModelArts

开发环境的应用示例 - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线