搜索_华为云

msprobe精度分析工具使用指导 - AI开发平台ModelArts

子可能与确定性计算存在冲突，如果开启确定性计算后多次执行的结果不相同，则考虑存在这些算子。否函数示例 seed_all函数的随机数种子，取默认值即可，无须配置；第二个参数默认关闭，不开启确定性计算时也无须配置。确定性计算是NPU的一套机制，用于保证算子的计算确定性。之所以要

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

整代码示例，供用户学习参考。训练流程简述相比于DP，DDP能够启动多进程进行运算，从而大幅度提升计算资源的利用率。可以基于torch.distributed实现真正的分布式计算，具体的原理此处不再赘述。大致的流程如下：初始化进程组。创建分布式并行模型，每个进程都会有相同的模型和参数。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
在ModelArts控制台查看监控指标 - AI开发平台ModelArts

底部的“总条数”数量不一致，请刷新重试。在各模块资源监控页签查看ModelArts监控指标训练作业：用户在运行训练作业时，可以查看多个计算节点的CPU、GPU、NPU资源使用情况。具体请参见训练资源监控章节。在线服务：用户将模型部署为在线服务后，可以通过监控功能查看CPU、

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
剪枝 - AI开发平台ModelArts
剪枝 - AI开发平台ModelArts

显存以及需要部署的资源依赖，减小推理过程中的计算量，降低增量推理时延，提升吞吐。 FASP (Fast and Accurate Structured Pruning) 一种针对LLM进行结构化剪枝的算法，可以减少大模型对于内存和计算资源的需求，提升推理速度，同时其具备比较高的剪

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

选择AI应用遵循的许可证。计算规格选择是按需选择计算规格。单击“选择”，在弹窗中选择资源规格并设置运行时长控制，单击“确定”。在“所在区”选择计算规格所在的区域。默认显示全部区域的计算规格。选择计算规格不可用的资源会置灰。右侧“配置信息”区域会显示计算规格的详细数据，AI G

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
AI开发基本流程介绍 - AI开发平台ModelArts

中处理并进行提炼，从而总结得到研究对象的内在规律。对数据进行分析，一般通过使用适当的统计、机器学习、深度学习等方法，对收集的大量数据进行计算、分析、汇总和整理，以求最大化地开发数据价值，发挥数据作用。 AI开发的基本流程 AI开发的基本流程通常可以归纳为几个步骤：确定目的、准备数据、训练模型、评估模型、部署模型。

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
包年/包月 - AI开发平台ModelArts
包年/包月 - AI开发平台ModelArts

您需要为每个计费周期预先付费，计费公式如表2所示。表2 计费公式资源类型计费公式资源单价计算资源实例规格单价 * 计算节点个数 * 购买时长请参见ModelArts价格详情中的“规格价格”。上述示例配置的费用计算如下：包年/包月专属资源池费用 = 1,750 * 1 * 2 = 3,500

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
msprobe梯度监控 - AI开发平台ModelArts

将模型权重的梯度数据导出。这种功能可以将模型权重的梯度值以统计量的形式采集出来，用以分析问题，例如检测确定性问题，使用训练状态监控工具监控NPU训练过程中的确定性计算问题。将两份梯度数据进行相似度对比。在有标杆问题中，可以确认训练过程中精度问题出现的Step，以及抓取反向过程中的问题。使用步骤如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
发布本地AI应用到AI Gallery - AI开发平台ModelArts

选择AI应用遵循的许可证。计算规格选择是按需选择计算规格。单击“选择”，在弹窗中选择资源规格并设置运行时长控制，单击“确定”。在“所在区”选择计算规格所在的区域。默认显示全部区域的计算规格。选择计算规格不可用的资源会置灰。右侧“配置信息”区域会显示计算规格的详细数据，AI G

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
创建AI应用 - AI开发平台ModelArts

security_policy 否 String 使用Edge加密模型后，获取模型加密策略 is_verify_app 否 Boolean Edge边缘场景，是否校验技能中的文件，包括配置文件、容器镜像、库文件等响应参数状态码：200 表14 响应Body参数参数参数类型描述 model_id

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
使用Msprobe工具分析偏差 - AI开发平台ModelArts

ed等自动化方式固定，先通过切换CPU侧计算初始化之后再切回device侧。在train.py中做如下图第215行代码修改。重新训练Dump比对分析后续计算是否存在偏差。比对之后发现：Tensor.__mul__.2在forward计算阶段的第一个input存在偏差。追溯代码

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 精度对齐
运行训练作业时提示URL连接超时 - AI开发平台ModelArts

运行训练作业时提示URL连接超时问题现象训练作业在运行时提示URL连接超时，具体报错如下： urllib.error.URLERROR:<urlopen error [Errno 110] Connection timed out> 原因分析由于安全性问题在ModelArts上不能联网下载。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 外网访问限制
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

定义镜像的部署参数。计算规格选择 - 按需选择计算规格。单击“选择”，在弹窗中选择资源规格并设置运行时长控制，单击“确定”。在“所在区”选择计算规格所在的区域。默认显示全部区域的计算规格。选择计算规格不可用的资源会置灰。右侧“配置信息”区域会显示计算规格的详细数据，AI G

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
自动续费 - AI开发平台ModelArts
自动续费 - AI开发平台ModelArts

自动续费可以减少手动续费的管理成本，避免因忘记手动续费而导致ModelArts中专属资源池不能使用。自动续费的规则如下所述：以专属资源池的到期日计算第一次自动续费日期和计费周期。专属资源池自动续费周期以您选择的续费时长为准。例如，您选择了3个月，专属资源池即在每次到期前自动续费3个月。

帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

件防范Web安全风险，并且通过WAF进行安全防护。所有承载ModelArts服务的主机部署了主机安全防护产品。包括不限于华为自研HSS或计算安全平台CSP。 ModelArts服务部署了漏洞扫描服务并自行进行例行扫描，能快速发现漏洞并能及时修复。 ModelArts服务通过统一的安全管控平台对云上资源进行安全运维。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
配置Lite Server存储 - AI开发平台ModelArts

行访问。使用场景如高性能计算、媒体处理、文件共享和内容管理和Web服务等。说明：高性能计算：主要是高带宽的需求，用于共享文件存储，比如基因测序、图片渲染这些。如大数据分析、静态网站托管、在线视频点播、基因测序和智能视频监控等。如高性能计算、企业核心集群应用、企业应用系统和开发测试等。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
终止训练作业 - AI开发平台ModelArts

job：训练作业 hetero_job：异构作业 autosearch_job：自动搜索作业 mrs_job：mrs作业 edge_job：边缘作业 metadata JobMetadata object 训练作业元信息。 status Status object 训练作业状态信息。创建作业无需填写。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
ModelArts Standard训练作业和模型部署如何收费？ - AI开发平台ModelArts

ModelArts支持将模型按照业务需求部署为服务。训练类型不同，部署后的计费方式不同。将模型部署为服务时，根据数据集大小评估模型的计算节点个数，根据实际编码情况选择计算模式。具体计费方式请参见ModelArts产品价格详情。父主题：计费FAQ

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
ModelArts入门实践 - AI开发平台ModelArts

Standard模型训练基于ModelArts Standard上运行GPU训练任务本案例介绍了如何使用ModelArts Standard专属资源池提供的计算资源，结合SFS和OBS存储，在ModelArts Standard的训练环境中开展单机单卡、单机多卡、多机多卡分布式训练。面向熟悉代码

 帮助中心 > AI开发平台ModelArts > 快速入门
使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

max_eval_samples int 最大测试数据数。计算规格选择，按需选择计算规格。单击“选择”，在弹窗中选择资源规格，单击“确定”。在“所在区”选择计算规格所在的区域。默认显示全部区域的计算规格。选择计算规格不可用的资源会置灰。右侧“配置信息”区域会显示计算规格的详细数据，AI Galler

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）

总条数： 548

上一页
1
...
11
12
13
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

msprobe精度分析工具使用指导 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

在ModelArts控制台查看监控指标 - AI开发平台ModelArts

剪枝 - AI开发平台ModelArts

将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

AI开发基本流程介绍 - AI开发平台ModelArts

包年/包月 - AI开发平台ModelArts

msprobe梯度监控 - AI开发平台ModelArts

发布本地AI应用到AI Gallery - AI开发平台ModelArts

创建AI应用 - AI开发平台ModelArts

使用Msprobe工具分析偏差 - AI开发平台ModelArts

运行训练作业时提示URL连接超时 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

自动续费 - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

ModelArts Standard训练作业和模型部署如何收费？ - AI开发平台ModelArts

ModelArts入门实践 - AI开发平台ModelArts

使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线