搜索_华为云

创建生产训练作业 - AI开发平台ModelArts

注意到系统自动注入的PATH环境变量，您可以参考下述命令确认训练作业最终使用的Python版本： export MA_HOME=/home/ma-user; docker run --rm {image} ${MA_HOME}/anaconda/bin/python -V docker

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

零改造迁移提供业界通用的k8s接口使用资源，业务跨云迁移无压力。 SSH直达节点和容器，一致体验。

帮助中心 > AI开发平台ModelArts > 产品介绍
Finetune训练 - AI开发平台ModelArts

main_training_function: main mixed_precision: fp16 num_machines: 1 num_processes: 8 rdzv_backend: static same_network: true tpu_env: [] tpu_use_cluster

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Kohya框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
在ModelArts训练得到的模型欠拟合怎么办？ - AI开发平台ModelArts

其他算法中：随机森林的树数量，k-means中的cluster数，正则化参数λ等。增加训练数据作用不大。欠拟合一般是因为模型的学习能力不足，一味地增加数据，训练效果并不明显。降低正则化约束。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明在大模型训练中，BF16（Brain Floating Point）和FP16（Float16）都是使用的半精度浮点数格式，但它们在结构和适用性上有一些重要的区别。 BF16：具有8个指数位和7个小数位。在处理大模型时有优势，能够避免在训练过程中数值的上溢或下溢

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明在大模型训练中，BF16（Brain Floating Point）和FP16（Float16）都是使用的半精度浮点数格式，但它们在结构和适用性上有一些重要的区别。 BF16：具有8个指数位和7个小数位。在处理大模型时有优势，能够避免在训练过程中数值的上溢或下溢

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练脚本说明
创建数据集 - AI开发平台ModelArts

表5 SourceInfo 参数是否必选参数类型描述 cluster_id 否 String MRS集群ID。可登录MRS控制台查看。 cluster_mode 否 String MRS集群运行模式。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
昇腾能力应用地图 - AI开发平台ModelArts

Llama-65b 推理 Ascend-vLLM 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）主流开源大模型基于Lite Cluster

帮助中心 > AI开发平台ModelArts > 最佳实践
BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明在大模型训练中，BF16（Brain Floating Point）和FP16（Float16）都是使用的半精度浮点数格式，但它们在结构和适用性上有一些重要的区别。 BF16：具有8个指数位和7个小数位。在处理大模型时有优势，能够避免在训练过程中数值的上溢或下溢

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明在大模型训练中，BF16（Brain Floating Point）和FP16（Float16）都是使用的半精度浮点数格式，但它们在结构和适用性上有一些重要的区别。 BF16：具有8个指数位和7个小数位。在处理大模型时有优势，能够避免在训练过程中数值的上溢或下溢

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
查看诊断报告 - AI开发平台ModelArts

查看诊断报告 Advisor分析profiling会输出html和xlsx两份文件。请优先查看html报告进行训练作业性能调优。xlsx中记录了html中全量数据，如集群计算、通信和下发的耗时，可以基于xlsx对计算耗时、下发耗时和带宽等列进行排序，从而快速过滤出计算慢卡、下发慢卡

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
ModelArts计费模式概述 - AI开发平台ModelArts

适用计费项计算资源计算资源、云硬盘适用资源池专属资源池公共资源池、专属资源池适用功能模块 Standard自动学习、Workflow、Notebook、模型训练、模型部署 Lite Cluster Lite Server Standard自动学习、Workflow、Notebook

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
部署在线服务 - AI开发平台ModelArts

cluster_id 否 String 旧版专属池id，默认为空，当配置cluster_id时，表示将服务部署到旧版专属资源池中。 pool_name 否 String 新版专属池名称。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
查询Notebook支持的有效规格列表 - AI开发平台ModelArts

查询Notebook支持的有效规格列表功能介绍查询运行Notebook实例所支持的有效规格列表。接口约束暂无约束调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
ModelArts中常用概念 - AI开发平台ModelArts

ModelArts Lite Server和ModelArts Lite Cluster使用的都是专属资源池。

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
自定义引擎创建模型规范 - AI开发平台ModelArts

在模型包文件夹的同级目录下验证如下命令拉起服务： docker run --user 1000:100 -p 8080:8080 -v model:/home/mind/model custom_engine:v1 该指令无法完全模拟线上，主要是由于-v挂载进去的目录是root

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

在模型包文件夹的同级目录下验证如下命令拉起服务： docker run --user 1000:100 -p 8080:8080 -v model:/home/mind/model custom_engine:v1 该指令无法完全模拟线上，主要是由于-v挂载进去的目录是root

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
开发环境的应用示例 - AI开发平台ModelArts

CPU algorithm development and training, preconfigured PySpark 2.4.5 and scala 2.11.12 for code development in local notebook and remote spark cluster

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
变更计费模式 - AI开发平台ModelArts

在ModelArts列表页，选择“资源管理 > AI专属资源池 > 弹性集群Cluster ”，在Standard资源池列表中选中目标专属资源池。在资源池详情页的右上角选择“更多 > 转包周期”。在弹出的“转包周期”页面，确认无误后单击“确定”。

帮助中心 > AI开发平台ModelArts > 计费说明
训练作业运行失败 - AI开发平台ModelArts

训练作业运行失败训练作业运行失败排查指导训练作业运行失败，出现NCCL报错自定义镜像训练作业失败定位思路使用自定义镜像创建的训练作业一直处于运行中使用自定义镜像创建训练作业找不到启动文件训练作业的监控内存指标持续升高直至作业失败订阅算法物体检测YOLOv3_ResNet18

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业

总条数： 1097

上一页
1
...
39
40
41
...
55
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建生产训练作业 - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

Finetune训练 - AI开发平台ModelArts

在ModelArts训练得到的模型欠拟合怎么办？ - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

昇腾能力应用地图 - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

BF16和FP16说明 - AI开发平台ModelArts

查看诊断报告 - AI开发平台ModelArts

ModelArts计费模式概述 - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

查询Notebook支持的有效规格列表 - AI开发平台ModelArts

ModelArts中常用概念 - AI开发平台ModelArts

自定义引擎创建模型规范 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

开发环境的应用示例 - AI开发平台ModelArts

变更计费模式 - AI开发平台ModelArts

训练作业运行失败 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线