搜索_华为云

查询算法详情 - AI开发平台ModelArts

resource_requirements Array of resource_requirements objects 算法资源约束，可不设置。设置后，在算法使用于训练作业时，控制台会过滤可用的公共资源池。 advanced_config advanced_config object

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
身份认证与访问控制 - AI开发平台ModelArts

远程接入管理使用本地IDE远程SSH连接ModelArts的Notebook开发环境时，需要用到密钥对进行鉴权认证。同时支持白名单访问控制，即设置允许远程接入访问这个Notebook的IP地址。父主题：安全

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
查询服务对象列表 - AI开发平台ModelArts

total_count Integer 不分页的情况下，符合查询条件的总服务数量。 count Integer 当前查询结果的服务数量，不设置offset、limit查询参数时，count与total相同。 services service结构数组查询到的服务集合。表3 service结构

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
查询样本列表 - AI开发平台ModelArts

false：不支持预览 process_parameter 否 String 图像缩略设置，同OBS缩略图设置，详见OBS缩略图设置。如：image/resize,m_lfit,h_200表示等比缩放目标缩略图并设置高度为200像素。 sample_state 否 String 样本状态。可选样本状态如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Standard资源管理 - AI开发平台ModelArts

专属资源池类型归一：不再区分训练、推理专属资源池。如果业务允许，您可以在一个专属资源池中同时跑训练和推理的Workload。同时，也可以通过“设置作业类型”来开启/关闭专属资源池对特定作业类型的支持。自助专属池网络打通：可以在ModelArts管理控制台自行创建和管理专属资源池所属

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
附录：训练常见问题 - AI开发平台ModelArts

问题4：Error waiting on exit barrier错误错误截图：报错原因：多线程退出各个节点间超时时间默认为300s，时间设置过短。解决措施：修改容器内torch/distributed/elastic/agent/server/api.py文件参数： vim

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）
删除镜像 - AI开发平台ModelArts
删除镜像 - AI开发平台ModelArts

INFERENCE: 建议仅在推理部署场景使用。 TRAIN: 建议仅在训练任务场景使用。 DEV: 建议仅在开发调测场景使用。 UNKNOWN: 未明确设置的镜像支持的服务类型。 size Long 镜像大小（单位KB）。 status String 镜像状态。枚举值如下： INIT：初始化。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

在创建训练作业页面配置环境变量“ROUTE_PLAN”，取值为“true”，具体操作请参见管理训练容器环境变量。代码示例训练作业的启动脚本示例如下。启动脚本中设置plog生成后存放在“/home/ma-user/modelarts/log/modelarts-job-{id}/worker-{ind

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
查询镜像详情 - AI开发平台ModelArts

INFERENCE: 建议仅在推理部署场景使用。 TRAIN: 建议仅在训练任务场景使用。 DEV: 建议仅在开发调测场景使用。 UNKNOWN: 未明确设置的镜像支持的服务类型。 size Long 镜像大小（单位KB）。 status String 镜像状态。枚举值如下： INIT：初始化。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
Standard资源池功能介绍 - AI开发平台ModelArts

资源池驱动进行升级。专属资源池提供了故障节点修复的功能，可参考修复Standard专属资源池故障节点修复故障节点。专属资源池提供了动态设置作业类型的功能，可参考修改Standard专属资源池支持的作业类型更新作业类型。专属资源池提供了工作空间功能，管理员可以根据工作空间，隔

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
资产识别与管理 - AI开发平台ModelArts

Gallery中的资产，AI Gallery会做统一的保存管理。对于文件类型的资产，AI Gallery会将资产保存在AI Gallery官方的OBS桶内。对于镜像类型的资产，AI Gallery会将资产保存在AI Gallery官方的SWR仓库内。对于用户提供的一些个人信息，AI

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

创建SFS Turbo文件系统前提条件：创建SFS Turbo文件系统前，确认已有可用的VPC。图4 创建SFS Turbo 需要由IAM用户设置SFS Turbo FullAccess权限，用于授权ModelArts云服务使用SFS Turbo。详细操作指导请参考创建SFS Turbo文件系统。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） > 准备工作
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

免由服务端发起关闭连接。如您使用的Gunicorn来作为web server，可以通过Gunicorn命令的--keep-alive参数来设置该值。其他方式导入的模型，服务内部已做处理。协议错误请求报错：{"error_code":"ModelArts.4503", "error_msg":"Failed

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

其他加速框架或ZeRO (Zero Redundancy Optimizer)优化器、NPU节点数即其他配置。具体优化工具使用说明可参考如何选择最佳性能的zero-stage和-offloads。父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
在ModelArts Standard上运行GPU单机单卡训练任务 - AI开发平台ModelArts

otebook实例配置信息。挂载OBS并行文件系统：在Notebook实例详情页面，选择“存储配置”页签，单击“添加数据存储”，设置挂载参数。设置本地挂载目录，在“/data/”目录下输入一个文件夹名称，例如：demo。挂载时，后台自动会在Notebook容器“的/data/

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
旧版训练迁移至新版训练需要注意哪些问题？ - AI开发平台ModelArts

where the trained ckpt file') args = parser.parse_args() ... # 下载的代码无需设置，后续涉及训练数据和输出路径数据使用data_url和train_url即可 #下载数据参数至容器本地，在代码中使用local_data_path代表训练输入位置

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
用户使用torch报错Unexpected error from cudaGetDeviceCount - AI开发平台ModelArts

system has unsupported display driver / cuda driver combination</module> 解决方式先排查cuda和torch版本是否兼容。 # cuda版本 nvcc --version # nvidia-smi版本 nvidia-smi

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
释放Standard专属资源池和删除网络 - AI开发平台ModelArts

如果您的资源中存在游离节点（即没有被纳管到资源池中的节点），您可在“AI专属资源池 > 弹性集群Cluster >节点”下查看此类节点的相关信息。针对游离节点，可以通过以下方式释放节点资源：如果是“包年/包月”且资源未到期的节点，您可单击操作列的“退订”，即可实现对单个节点的资源释放。支持批量退订节点。如果是

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──llm_tools # 推理工具工作目录介绍详细的工作目录参考如下，建议参考以下要求设置工作目录。训练脚本以分类的方式集中在scripts文件夹中。 ${workdir}（例如/home/ma-user/ws ） |──llm_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
准备Notebook - AI开发平台ModelArts

准备Notebook ModelArts Notebook云上云下，无缝协同，更多关于ModelArts Notebook的详细资料请查看Notebook使用场景介绍。本案例中使用ModelArts的开发环境Notebook部署推理服务进行调试，请按照以下步骤完成Notebook的创建。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 准备工作

总条数： 1770

上一页
1
...
81
82
83
...
89
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询算法详情 - AI开发平台ModelArts

身份认证与访问控制 - AI开发平台ModelArts

查询服务对象列表 - AI开发平台ModelArts

查询样本列表 - AI开发平台ModelArts

Standard资源管理 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

删除镜像 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

查询镜像详情 - AI开发平台ModelArts

Standard资源池功能介绍 - AI开发平台ModelArts

资产识别与管理 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练任务 - AI开发平台ModelArts

旧版训练迁移至新版训练需要注意哪些问题？ - AI开发平台ModelArts

用户使用torch报错Unexpected error from cudaGetDeviceCount - AI开发平台ModelArts

释放Standard专属资源池和删除网络 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线