搜索_华为云

升级Standard专属资源池驱动 - AI开发平台ModelArts

“按节点数量”两种滚动方式。按节点比例：每批次驱动升级的节点数量为“节点比例*资源池节点总数”。按节点数量：每批次驱动升级的节点数量为设置的节点数量。对于不同的升级方式，滚动升级选择节点的策略会不同：如果升级方式为安全升级，则根据滚动节点数量选择无业务的节点，隔离节点并滚动升级。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
Standard资源池节点故障定位 - AI开发平台ModelArts

dcmi接口检测到driver异常。 NPU驱动环境异常。 A050122 NPU 其他 npu dcmi device异常。 NPU设备异常，昇腾dcmi接口中返回设备存在重要或紧急告警。 A050123 NPU 链路 npu dcmi net异常。 NPU网络链接异常。 A050129 NPU

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
使用大模型在ModelArts Standard创建AI应用部署在线服务 - AI开发平台ModelArts

通过专属资源池详情页面，规格页签，查看专属资源池磁盘信息。当服务部署失败，提示磁盘空间不足时，请参考服务部署、启动、升级和修改时，资源不足如何处理？图2 查看专属资源池磁盘信息创建AI应用使用大模型创建AI应用，选择从对象存储服务（OBS）中导入，需满足以下参数配置：采用自定义引擎，开启动态加载

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

py”。超参当资源规格为单机多卡时，需要指定超参world_size和rank。当资源规格为多机时（即计算节点个数大于 1），无需设置超参world_size和rank，超参会由平台自动注入。方式二：使用自定义镜像功能，通过torch.distributed.launch命令启动训练作业。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
训练启动脚本说明和参数配置 - AI开发平台ModelArts

规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量文本序列长度并行参数设置规格与节点数 1 llama2 llama2-7b SEQ_LEN=4096 TP(tensor model

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
更新算法 - AI开发平台ModelArts
更新算法 - AI开发平台ModelArts

resource_requirements 否 Array of ResourceRequirement objects 算法资源约束。可不设置。设置后，在算法使用于训练作业时，控制台会过滤可用的公共资源池。 advanced_config 否 AlgorithmAdvancedConfig

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
Wav2Lip基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info # 在每个实例节点上运行此命令可以看到NPU卡状态

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
查询服务列表 - AI开发平台ModelArts

total_count Integer 不分页的情况下，符合查询条件的总服务数量。 count Integer 当前查询结果的服务数量，不设置offset、limit查询参数时，count与total相同。 services service结构数组查询到的服务集合。表3 service结构

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

其他加速框架或ZeRO (Zero Redundancy Optimizer)优化器、NPU节点数即其他配置。具体优化工具使用说明可参考如何选择最佳性能的zero-stage和-offloads。父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
Wav2Lip推理基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info # 在每个实例节点上运行此命令可以看到NPU卡状态

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
创建DevServer - AI开发平台ModelArts

String> 通过应用专属URL直接打开应用进入远程开发模式。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。表9 EndpointsRes 参数参数类型描述 allowed_access_ips Array

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
从对象存储服务（OBS）中选择元模型 - AI开发平台ModelArts

AI应用基本信息参数说明参数名称说明名称 AI应用名称。支持1～64位可见字符（含中文），名称可以包含字母、中文、数字、中划线、下划线。版本设置所创建AI应用的版本。第一次导入时，默认为0.0.1。说明： AI应用创建完成后，可以通过创建新版本，导入不同的元模型进行调优。描述 AI应用的简要描述。

帮助中心 > AI开发平台ModelArts > 推理部署（历史文档待下线） > 管理AI应用 > 创建AI应用
从OBS中导入AI应用文件创建模型 - AI开发平台ModelArts

AI应用基本信息参数说明参数名称说明名称 AI应用名称。支持1～64位可见字符（含中文），名称可以包含字母、中文、数字、中划线、下划线。版本设置所创建AI应用的版本。第一次导入时，默认为0.0.1。说明： AI应用创建完成后，可以通过创建新版本，导入不同的元模型进行调优。描述 AI应用的简要描述。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建AI应用
InternVL2基于DevServer适配PyTorch NPU训练微调指导（6.3.908） - AI开发平台ModelArts

254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。 SSH登录机器后，检查NPU卡状态。运行如下命令，返回NPU设备信息。 npu-smi info # 在每个实例节点上运行此命令可以看到NPU卡状态 npu-smi

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
查询智能标注的样本列表 - AI开发平台ModelArts

desc：递减排序（默认值） process_parameter 否 String 图像缩略设置，同OBS缩略图设置，详见OBS缩略图设置。如：image/resize,m_lfit,h_200表示等比缩放目标缩略图并设置高度为200像素。 search_conditions 否 String U

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备预测分析数据 - AI开发平台ModelArts

创建数据集数据准备完成后，需要创建预测分析项目支持的类型的表格数据集，具体操作请参考创建数据集。常见问题使用从OBS选择的数据创建表格数据集如何处理Schema信息？ Schema信息代表表格的列名和对应类型，需要跟导入数据的列数保持一致。如果您的原始表格中已包含表头，需要开启“

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
查询专属资源池列表 - AI开发平台ModelArts

描述 total_count Integer 不分页的情况下符合查询条件的总集群数量。 count Integer 当前查询结果的集群数量，不设置offset、limit查询参数时，count与total相同。 clusters Array of Cluster objects 查询到的集群列表。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──AscendSpeed # 基于AscendSpeed的训练代码工作目录介绍详细的工作目录参考如下，建议参考以下要求设置工作目录。 ${workdir}（例如/home/ma-user/ws ） |──llm_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──AscendSpeed # 基于AscendSpeed的训练代码工作目录介绍详细的工作目录参考如下，建议参考以下要求设置工作目录。 ${workdir}（例如/home/ma-user/ws ） |──llm_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 准备工作
标注文本分类数据 - AI开发平台ModelArts

变化，修改用于标注的标签。支持添加、修改和删除标签。添加标签在“未标注”页签下，单击“标签集”右侧的加号，在弹出“新增标签”对话框中，设置“标签名称”和“标签颜色”，然后单击“确定”完成标签添加。修改标签在“已标注”页签中“全部标签”的下方操作列，选择需要修改的标签，单击

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现文本分类

总条数： 1067

上一页
1
...
48
49
50
...
54
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

升级Standard专属资源池驱动 - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

使用大模型在ModelArts Standard创建AI应用部署在线服务 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

更新算法 - AI开发平台ModelArts

Wav2Lip基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

Wav2Lip推理基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

创建DevServer - AI开发平台ModelArts

从对象存储服务（OBS）中选择元模型 - AI开发平台ModelArts

从OBS中导入AI应用文件创建模型 - AI开发平台ModelArts

InternVL2基于DevServer适配PyTorch NPU训练微调指导（6.3.908） - AI开发平台ModelArts

查询智能标注的样本列表 - AI开发平台ModelArts

准备预测分析数据 - AI开发平台ModelArts

查询专属资源池列表 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

标注文本分类数据 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线