搜索_华为云

使用SDK调测单机训练作业 - AI开发平台ModelArts

参数，训练使用的worker个数，单机训练时为1，训练作业只在当前使用的notebook中运行。 script_interpreter：可选参数，指定使用哪个python环境来执行训练任务，如果未指定，会默认使用当前的kernel。 log_url：可选参数，一个OBS地址，训练

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
语言模型推理性能测试 - AI开发平台ModelArts

output-tokens使用真实数据集进行测试。 --dataset-type：当使用投机推理时开启，benchmark使用的数据类型，当前支持random、sharegpt、human-eval三种输入。random表示构造随机token的数据集进行测试；sharegpt表示

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试
批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

ModelArts.3551：数据输入或者输出的obs目录不存在 ModelArts.3567：使用的数据输入或者输出obs目录存在，但是当前账号无权限访问处理方法 ModelArts.3551：到obs检查输入数据目录是否存在，如果不存在，请按照实际需要创建obs目录；如果检

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

登录ModelArts管理控制台。在左侧导航栏中，选择“模型训练 > 训练作业”进入训练作业列表。单击“创建训练作业”，进入创建训练作业页面，填写作业信息，创建方式参考表1，其他参数填写请参考创建训练作业。表1 创建训练作业的创建方式（使用自定义镜像）参数名称说明创建方式必选，选择“自定义算法”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
推理服务测试 - AI开发平台ModelArts

print(predict_result) 参数说明表1 参数说明参数是否必选参数类型描述 data_type 是 String 当前支持三种格式：files、images、json，即文本、图片、json格式。 data 是 String 针对files、images类型的数据，

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
训练业务迁移到昇腾设备场景介绍 - AI开发平台ModelArts

发套件以及迁移调优工具链，最大程度减少客户自行配置环境的复杂度。范围本文涉及PyTorch训练的单卡和分布式业务迁移到昇腾的业务范围。当前针对常见的开源LLM/AIGC等领域的开源模型，ModelArts已经提供了迁移好的开箱即用模型，且保证了较优的精度和性能。如果用户业务同

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
Step1 创建用户组并加入用户 - AI开发平台ModelArts

账号，可以创建子账号并加入用户组。创建子用户账号并加入用户组。在IAM左侧菜单栏中，选择“用户”，单击右上角“创建用户”，在“创建用户”页面中，添加多个用户。请根据界面提示，填写必选参数，然后单击“下一步”。在“加入用户组”步骤中，选择“用户组02”，然后单击“创建用户”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
报错提示RuntimeError: Default process group has not been initialized, please make sure to call init_process_group - AI开发平台ModelArts

# ptuning/run_npu_1d.sh export ASCEND_RT_VISIBLE_DEVICES=0 # 指定 0 号卡对当前进程可见 PRE_SEQ_LEN=128 LR=2e-2 python3 ptuning/main.py \ --do_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导 > 常见问题
语言模型推理性能测试 - AI开发平台ModelArts

output-tokens使用真实数据集进行测试。 --dataset-type：当使用投机推理时开启，benchmark使用的数据类型，当前支持random、sharegpt、human-eval三种输入。random表示构造随机token的数据集进行测试；sharegpt表示

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

Lite Server GPU裸金属服务器使用EulerOS内核误升级如何解决 GPU A系列裸金属服务器无法获取显卡如何解决 GPU裸金属服务器无法Ping通如何解决 GPU A系列裸金属服务器RoCE带宽不足如何解决？ GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed

帮助中心 > AI开发平台ModelArts > 故障排除
批量更新团队标注样本的标签 - AI开发平台ModelArts

是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workforce_task_id 是 String 标注任务ID。请求参数表2 请求Body参数参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
模型训练使用流程 - AI开发平台ModelArts

训练高可靠性查看训练结果和日志查看训练作业详情训练作业运行中或运行结束后，可以在训练作业详情页面查看训练作业的参数设置，训练作业事件等。查看训练作业日志训练日志用于记录训练作业运行过程和异常信息，可以通过查看训练作业日志定位作业运行中出现的问题。表2 训练作业的创建方式介绍创建方式

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
部署服务如何选择计算节点规格？ - AI开发平台ModelArts

2u，只要资源池有资源，就可以选择使用。一些特殊的规格需要联系系统管理员增加权限。 2、公共资源池的规格无法选择共享池的资源是有限的，显示置灰表示当前规格的资源已经被用完。请选择未置灰的规格，也可以创建自己的专属资源池。 3、自定义规格只有在专属资源池部署服务时，支持自定义资源规格。公共资源池部署服务不支持。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询
【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

-988或+86-950808）与我们联系。常见问题为什么要下线模型转换？ ModelArts模型转换向AI开发者提供了便捷的模型转换页面，将Tensorflow和Caffe框架的模型格式转换为MindSpore的模型格式，即模型后缀为.om，使之能在昇腾硬件中进行推理。由于

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
在Workflow中指定仅运行部分节点 - AI开发平台ModelArts

略），在policy中定义了两个预置场景：模型训练和服务部署，工作流发布至运行态后，部分运行的开关默认关闭，节点全部运行。用户可在权限管理页面打开开关，选择指定的场景进行运行。部分运行能力支持同一个节点被定义在不同的运行场景中，但是需要用户自行保证节点之间数据依赖的正确性。另外

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > Workflow高阶能力
专属资源池VPC打通 - AI开发平台ModelArts

打通VPC”。图1 打通VPC 在打通VPC弹框中，打开“打通VPC”开关，在下拉框中选择可用的VPC和子网。需要打通的对端网络不能和当前网段重叠。图2 打通VPC参数选择如果没有VPC可选，可以单击右侧的“创建虚拟私有云”，跳转到网络控制台，申请创建虚拟私有云。如果没

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

Studio”进入ModelArts Studio大模型即服务平台。在ModelArts Studio左侧导航栏中，选择“应用实践中心”跳转到“MaaS应用实践中心”页面。在“行业解决方案”选择应用，跳转到应用详情页，了解应用实现方案。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
分页查询团队标注任务下的样本列表 - AI开发平台ModelArts

是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workforce_task_id 是 String 团队标注任务ID。表2 Query参数参数是否必选参数类型

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
批量更新样本标签 - AI开发平台ModelArts

是否必选参数类型描述 dataset_id 是 String 数据集ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 email 否 String 团队标注成员邮箱。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

在Notebook中，无法直接使用默认版本的torchvision获取数据集，因此示例代码中提供了三种训练数据加载方式。 cifar-10数据集下载链接，单击“CIFAR-10 python version”。尝试基于torchvision获取cifar10数据集。基于数据链接下载数据并解压

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练

总条数： 1651

上一页
1
...
68
69
70
...
83
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用SDK调测单机训练作业 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

推理服务测试 - AI开发平台ModelArts

训练业务迁移到昇腾设备场景介绍 - AI开发平台ModelArts

Step1 创建用户组并加入用户 - AI开发平台ModelArts

报错提示RuntimeError: Default process group has not been initialized, please make sure to call init_process_group - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

批量更新团队标注样本的标签 - AI开发平台ModelArts

模型训练使用流程 - AI开发平台ModelArts

部署服务如何选择计算节点规格？ - AI开发平台ModelArts

【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

在Workflow中指定仅运行部分节点 - AI开发平台ModelArts

专属资源池VPC打通 - AI开发平台ModelArts

在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

分页查询团队标注任务下的样本列表 - AI开发平台ModelArts

批量更新样本标签 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线